Страница 1 из 1

Помогите разобраться с .djvu

Добавлено: Чт июн 11, 2009 1:37 pm
Gigom
Есть проблема у не очень уверенного пользователя ПЭВМ. Помогите, пожалуйста.
Скачал .djvu текст на этом сайте. Он прекрасно работает: переводиться и в .pdf и во всякие другие форматы (картинки, фотографии и т.п.); с помощью кнопочек в инструментах (Tools) "выделение текста", "выделение изображения" и "копирование" любой текстовой и рисуночный фрагмент переноситься в любой другой формат любого другого файла (конкретно - в Word файл .doc) и можно дальше работать. Есть, правда, небольшие огрехи с переносом слов, расшифровкой некоторых цифр, иностранных букв и формул, но это легко правиться в файле .doc., т.е. нет особых проблем.
Скопировал другой текст .djvu с других 4 сайтов - одно и тоже: картинки вырезаются, копируются и переносятся в Word файл .doc, а вот текст не выделяется, не копируется и не переноситься, т.к. кнопочки для текста не работают. Перепробовал массу .djvu-программок, взял один и тот же текст с 4 различных сайтов (в т.ч. с официального МГУ), преподробно сравнил все настройки опций .djvu первого текста и второго (не работающего) текста - ничего не получается третьи сутки подряд. Помогите.
С уважением, Гигом.

Re: Помогите разобраться с .djvu

Добавлено: Чт июн 11, 2009 7:51 pm
Павел
Возможно, в "проблемных" файлах текст не отделён от фона. В этом случае операции с текстом действительно недоступны (текст фактически является рисунком).
Надеюсь, что я ошибаюсь.

Re: Помогите разобраться с .djvu

Добавлено: Пт июн 12, 2009 1:11 am
Gigom
Спасибо.
Если это так, то как это узнать? И есть ли какие-нибудь "ретрансляторы, редакторы, корректировщики и т.п." - не знаю, как их назвать, которые могут из рисунка сделать текст?
С уважением, Гигом.

Re: Помогите разобраться с .djvu

Добавлено: Пт июн 12, 2009 7:00 am
Павел
Как это узнать - не могу сказать. Я же говорю - это гипотеза.
Из рисунка - текст делает, например, "Finereader".

Re: Помогите разобраться с .djvu

Добавлено: Вт сен 01, 2009 6:16 am
Xammer77
Gigom писал(а):Есть проблема у не очень уверенного пользователя ПЭВМ. Помогите, пожалуйста.
Скачал .djvu текст на этом сайте. Он прекрасно работает: переводиться и в .pdf и во всякие другие форматы (картинки, фотографии и т.п.); с помощью кнопочек в инструментах (Tools) "выделение текста", "выделение изображения" и "копирование" любой текстовой и рисуночный фрагмент переноситься в любой другой формат любого другого файла (конкретно - в Word файл .doc) и можно дальше работать. Есть, правда, небольшие огрехи с переносом слов, расшифровкой некоторых цифр, иностранных букв и формул, но это легко правиться в файле .doc., т.е. нет особых проблем.
Скопировал другой текст .djvu с других 4 сайтов - одно и тоже: картинки вырезаются, копируются и переносятся в Word файл .doc, а вот текст не выделяется, не копируется и не переноситься, т.к. кнопочки для текста не работают. Перепробовал массу .djvu-программок, взял один и тот же текст с 4 различных сайтов (в т.ч. с официального МГУ), преподробно сравнил все настройки опций .djvu первого текста и второго (не работающего) текста - ничего не получается третьи сутки подряд. Помогите.
С уважением, Гигом.



Почитатйте здесь http://djvu-inf.narod.ru/.
Это формат изображения! И извлечь текст, как таковой - нереально!

Re: Помогите разобраться с .djvu

Добавлено: Вт сен 01, 2009 7:12 am
Павел
Спасибо за ссылку.

Re: Помогите разобраться с .djvu

Добавлено: Вт сен 01, 2009 8:52 am
Viktor
Xammer77 писал(а):Это формат изображения! И извлечь текст, как таковой - нереально!


Не надо вводить неискушенных людей в заблуждение: формат djvu прекрасно поддерживает внедренный OCR-слой, с которым можно работать как с обычным текстом (конечно,если при создании djvu-документа он был туда внедрен).
Подробности здесь: http://www.djvu-soft.narod.ru/soft/basic.htm#9 Вопросы №13 и 14

Re: Помогите разобраться с .djvu

Добавлено: Ср ноя 25, 2009 2:36 am
catty
Gigom писал(а):Есть проблема у не очень уверенного пользователя ПЭВМ. Помогите, пожалуйста.

Гигом, к сожалению, в вашем случае ничего не получится, так как большинство пользователей ру-нета делают книги (по крайней мере по геологии, за исключением данного ресурса и еще юрасика) в djvu-формате без текстового слоя (того самого, о котором сказал Victor). В Вашем случае книги без этого текстового слоя, поэтому перекинуть текст в doc формат нереально. Единственное, что могу посоветовать - распознайте книгу сами. Самый простой способ для "не очень уверенного пользователя ПЭВМ": перевести страницы книги (Файл-Экспорт страницы) в формат jpeg, а затем распознать с помощью FineReader'a.
Евгения.

Re: Помогите разобраться с .djvu

Добавлено: Ср ноя 25, 2009 10:46 am
Gigom
Спасибо, Евгения!
Я нашёл какой-то иностранный ретранслятор и пробовал так, как Вы посоветовали. В Вашем случае ошибок ретрансляции много больше. Поэтому беру текст, благо у меня много словарей на бумажных носителях, и правлю в ручную. Производительность: 50-150 стр. в сутки. Закончил Левинсон-Лессинга. Заканчиваю Криштановского. Работаю над Горной энциклопедией (кстати, она лучше всего переводится в Word.doc).
С уважением, Гигом.

Re: Помогите разобраться с .djvu

Добавлено: Пт янв 15, 2010 5:20 am
vikrorpert
Viktor писал(а):
Xammer77 писал(а):Это формат изображения! И извлечь текст, как таковой - нереально!


Не надо вводить неискушенных людей в заблуждение: формат djvu прекрасно поддерживает внедренный OCR-слой, с которым можно работать как с обычным текстом (конечно,если при создании djvu-документа он был туда внедрен).
Подробности здесь: http://www.djvu-soft.narod.ru/soft/basic.htm#9 Вопросы №13 и 14


спасибо за ссылку


_______________
бесплатные прокси

Re: Помогите разобраться с .djvu

Добавлено: Сб авг 10, 2013 7:56 pm
Nikolay
Да, действительно, формат djvu поддерживает OCR-слой... если его туда внедрить. Команда geo.web.ru при сканировании книг его внедряет. Для этого используются FineReader и DJVU OCR. При помощи них можно распознавать и стороннее файлы.