Официальный сайт студ.городка НГТУ
Программирование и БД » обработка php файлов Microsoft Word 

#1  17.06.08 18:32

обработка php файлов Microsoft Word

у меня есть два файла с расширением .doc (Microsoft Word). В одном из них заполненная таблица 300 строчек на 8 столбцов. Второй представляет некий шаблон, в определенных местах которого имеются поля, которые должны быть заполены значениями из разных столбцов одной строки первого файла.
Как уже наверное стало ясно, необходимо триста раз заполнить этот шаблон и получить на выходе соотсветсвенно триста файлов одного образца, но с разными значениями.
Как проще автоматизировать этот процесс?

Пытался написать скрипт на php, но всё упирается в невозможность (?) выудить текст из файла с расширением doc.

Offline

#2  17.06.08 18:47

Re: обработка php файлов Microsoft Word

doc по сути бинарный файл, проще наверное использовать встроенный вордовский vbscript

Offline

#3  18.06.08 00:30

Re: обработка php файлов Microsoft Word

кажется, нашел.

нужно сохранять doc как веб-страницу (htm) и дальше уже работать с ней. так и форматирование сохраняется, и текст можно вытащить

Offline

#4  18.06.08 13:59

Re: обработка php файлов Microsoft Word

grozzzzza, тогда уж лучше пользовать либо RTF, либо XML...

Offline

#5  18.06.08 17:54

Re: обработка php файлов Microsoft Word

вот есть скрипт http://obninsk.name/obninsk_doc/
от текст вытаскивает из ворда..мож пригодится

Offline

#6  18.06.08 18:42

Re: обработка php файлов Microsoft Word

Jaguar, из RTF тоже не вытащить.

всё, уже сделал (через htm). решение полностью удовлетворяет требованиям исходным.

Offline

#7  19.06.08 09:07

Re: обработка php файлов Microsoft Word

grozzzzza, все вытаскивается...

Offline

#8  20.06.08 10:45

Re: обработка php файлов Microsoft Word

grozzzzza, а платформа какая? у меня тоже есть задача вытащить текст из файлов офисных.

Offline

#9  20.06.08 12:01

Re: обработка php файлов Microsoft Word

A-Lex, есть классы для работы с доками через либы OOo...

Offline

#10  20.06.08 15:27

Re: обработка php файлов Microsoft Word

Jaguar, можешь подсказать? Та либа, про которую iDrum написал немного коряво работает :(

Offline

#11  23.06.08 13:38

Re: обработка php файлов Microsoft Word

A-Lex, например http://phpdocwriter.sourceforge.net/
или http://webscripts.softpedia.com/script/ … 41678.html

Исправлено Jaguar (23.06.08 13:40)

Offline

#12  23.06.08 13:45

Re: обработка php файлов Microsoft Word

Jaguar, кул, но это либы для создания документов формата OpenOffice.org и Simple RTF, а требуется их читать, причём не только OpenOffice и RTF, а OpenOffice, Microsoft Office и тд.
Сохранять в док не так сложно, а тем более в RTF, так как это тот же HTML и изменёнными тегами и счётчиками объектов

Offline

#13  23.06.08 15:25

Re: обработка php файлов Microsoft Word

Нужно что-то вроде этого: soffice -accept="socket,host=localhost,port=9303;urp;StarOffice.ServiceManager";

ОпенОфис умеет работать в моде сервера и слушать на определенном порту. Посмотри проект Alfresco. Там нечто подобное написано на яве. Адаптировать думаю сможешь. Только вот ООо без гуи не запускается, т.ч. смотри варианты его запуска в Xvfb, если тебе под линь надо. Уже готовый класс не могу найти. Давно на него натыкался, а щас не могу найти...

Offline

#14  23.06.08 15:35

Re: обработка php файлов Microsoft Word

возможно перепутал с перлом... но факт, что это есть и оно возможно...

Offline

Программирование и БД » обработка php файлов Microsoft Word 

ФутЕр:)

© Hostel Web Group, 2002-2025.   Сообщить об ошибке

Сгенерировано за 0.035 сек.
Выполнено 14 запросов.