#1 07.04.08 01:49
Как из *.pdf вытащить текст?
Пытаюсь сохранить как текст, в итоге либо часть текста, либо весь текст сохраняется в виде кучи нечитаемых символов. Открывал блокнотом, вордпадом и вордом. Менял кодировку - всё бесполезно. Как решить проблему?
Offline
#3 07.04.08 10:37
Re: Как из *.pdf вытащить текст?
Antony написал(а):
распознать finereader-ом
Принтскринить, а потом как картинку распознать? Это долго будет, там листов много. Может ещё как-нибудь можно?
Исправлено N-Zero (07.04.08 10:52)
Offline
#4 07.04.08 11:02
Re: Как из *.pdf вытащить текст?
не надо принтскринить... Ctrl+O и выбери там свой PDF
Offline
#6 09.04.08 21:37
Re: Как из *.pdf вытащить текст?
поставить восьмой акробат, выделить текст мышкой и скопировать
Offline
#9 17.04.08 21:50
Re: Как из *.pdf вытащить текст?
Fine Reader при распозновании набор симвоов выдает.
и при открытии некоторых пдфок...
чё делать?)\
шрифты какие-то не поддерживает?
Offline
#10 19.04.08 02:21
Re: Как из *.pdf вытащить текст?
Я пользуюсь Foxit Pro можно подключать дополнительные программы (в том числе изменение текта pdf). Скопировать тект PDF-ника напрямую не всегда удаётся, зависит наверное от разрешения...
На худой конец можно распознать через ABBYY READER.
#11 23.04.08 12:44
Re: Как из *.pdf вытащить текст?
ABBYY READER - идеально подойдет, сама постоянно через неё гоняю, там пункт в меню есть scan Image/PDF...
Offline
#12 05.05.08 22:57
Re: Как из *.pdf вытащить текст?
если текст шифрованный или просто картинкой в тот же ПДФ вставлен, то ты хоть законвертируйся. Надо либо знать пароль, если все же текст редактируемый, либо распознать в ридере, как говорили выше. Есть еще вариант со взломом пароля, но это совсем другая история ;)
Offline

