Помогите разобраться с .djvu

Обсуждение программ и утилит, полезных для геологов

Модератор: catty

Ответить
Gigom
Сообщения: 1483
Зарегистрирован: Вс окт 14, 2007 10:40 pm

Помогите разобраться с .djvu

Сообщение Gigom » Чт июн 11, 2009 1:37 pm

Есть проблема у не очень уверенного пользователя ПЭВМ. Помогите, пожалуйста.
Скачал .djvu текст на этом сайте. Он прекрасно работает: переводиться и в .pdf и во всякие другие форматы (картинки, фотографии и т.п.); с помощью кнопочек в инструментах (Tools) "выделение текста", "выделение изображения" и "копирование" любой текстовой и рисуночный фрагмент переноситься в любой другой формат любого другого файла (конкретно - в Word файл .doc) и можно дальше работать. Есть, правда, небольшие огрехи с переносом слов, расшифровкой некоторых цифр, иностранных букв и формул, но это легко правиться в файле .doc., т.е. нет особых проблем.
Скопировал другой текст .djvu с других 4 сайтов - одно и тоже: картинки вырезаются, копируются и переносятся в Word файл .doc, а вот текст не выделяется, не копируется и не переноситься, т.к. кнопочки для текста не работают. Перепробовал массу .djvu-программок, взял один и тот же текст с 4 различных сайтов (в т.ч. с официального МГУ), преподробно сравнил все настройки опций .djvu первого текста и второго (не работающего) текста - ничего не получается третьи сутки подряд. Помогите.
С уважением, Гигом.
С уважением, Гигом.

Аватара пользователя
Павел
Участник
Сообщения: 10499
Зарегистрирован: Пн июн 12, 2006 4:31 pm
Откуда: г. Красноярск
Контактная информация:

Re: Помогите разобраться с .djvu

Сообщение Павел » Чт июн 11, 2009 7:51 pm

Возможно, в "проблемных" файлах текст не отделён от фона. В этом случае операции с текстом действительно недоступны (текст фактически является рисунком).
Надеюсь, что я ошибаюсь.

Gigom
Сообщения: 1483
Зарегистрирован: Вс окт 14, 2007 10:40 pm

Re: Помогите разобраться с .djvu

Сообщение Gigom » Пт июн 12, 2009 1:11 am

Спасибо.
Если это так, то как это узнать? И есть ли какие-нибудь "ретрансляторы, редакторы, корректировщики и т.п." - не знаю, как их назвать, которые могут из рисунка сделать текст?
С уважением, Гигом.
С уважением, Гигом.

Аватара пользователя
Павел
Участник
Сообщения: 10499
Зарегистрирован: Пн июн 12, 2006 4:31 pm
Откуда: г. Красноярск
Контактная информация:

Re: Помогите разобраться с .djvu

Сообщение Павел » Пт июн 12, 2009 7:00 am

Как это узнать - не могу сказать. Я же говорю - это гипотеза.
Из рисунка - текст делает, например, "Finereader".

Xammer77
Сообщения: 1
Зарегистрирован: Вт сен 01, 2009 6:04 am

Re: Помогите разобраться с .djvu

Сообщение Xammer77 » Вт сен 01, 2009 6:16 am

Gigom писал(а):Есть проблема у не очень уверенного пользователя ПЭВМ. Помогите, пожалуйста.
Скачал .djvu текст на этом сайте. Он прекрасно работает: переводиться и в .pdf и во всякие другие форматы (картинки, фотографии и т.п.); с помощью кнопочек в инструментах (Tools) "выделение текста", "выделение изображения" и "копирование" любой текстовой и рисуночный фрагмент переноситься в любой другой формат любого другого файла (конкретно - в Word файл .doc) и можно дальше работать. Есть, правда, небольшие огрехи с переносом слов, расшифровкой некоторых цифр, иностранных букв и формул, но это легко правиться в файле .doc., т.е. нет особых проблем.
Скопировал другой текст .djvu с других 4 сайтов - одно и тоже: картинки вырезаются, копируются и переносятся в Word файл .doc, а вот текст не выделяется, не копируется и не переноситься, т.к. кнопочки для текста не работают. Перепробовал массу .djvu-программок, взял один и тот же текст с 4 различных сайтов (в т.ч. с официального МГУ), преподробно сравнил все настройки опций .djvu первого текста и второго (не работающего) текста - ничего не получается третьи сутки подряд. Помогите.
С уважением, Гигом.



Почитатйте здесь http://djvu-inf.narod.ru/.
Это формат изображения! И извлечь текст, как таковой - нереально!

Аватара пользователя
Павел
Участник
Сообщения: 10499
Зарегистрирован: Пн июн 12, 2006 4:31 pm
Откуда: г. Красноярск
Контактная информация:

Re: Помогите разобраться с .djvu

Сообщение Павел » Вт сен 01, 2009 7:12 am

Спасибо за ссылку.

Viktor
Участник
Сообщения: 336
Зарегистрирован: Ср сен 20, 2006 10:16 am

Re: Помогите разобраться с .djvu

Сообщение Viktor » Вт сен 01, 2009 8:52 am

Xammer77 писал(а):Это формат изображения! И извлечь текст, как таковой - нереально!


Не надо вводить неискушенных людей в заблуждение: формат djvu прекрасно поддерживает внедренный OCR-слой, с которым можно работать как с обычным текстом (конечно,если при создании djvu-документа он был туда внедрен).
Подробности здесь: http://www.djvu-soft.narod.ru/soft/basic.htm#9 Вопросы №13 и 14

Аватара пользователя
catty
Сообщения: 248
Зарегистрирован: Сб мар 31, 2007 10:37 pm
Откуда: Ухта

Re: Помогите разобраться с .djvu

Сообщение catty » Ср ноя 25, 2009 2:36 am

Gigom писал(а):Есть проблема у не очень уверенного пользователя ПЭВМ. Помогите, пожалуйста.

Гигом, к сожалению, в вашем случае ничего не получится, так как большинство пользователей ру-нета делают книги (по крайней мере по геологии, за исключением данного ресурса и еще юрасика) в djvu-формате без текстового слоя (того самого, о котором сказал Victor). В Вашем случае книги без этого текстового слоя, поэтому перекинуть текст в doc формат нереально. Единственное, что могу посоветовать - распознайте книгу сами. Самый простой способ для "не очень уверенного пользователя ПЭВМ": перевести страницы книги (Файл-Экспорт страницы) в формат jpeg, а затем распознать с помощью FineReader'a.
Евгения.

Gigom
Сообщения: 1483
Зарегистрирован: Вс окт 14, 2007 10:40 pm

Re: Помогите разобраться с .djvu

Сообщение Gigom » Ср ноя 25, 2009 10:46 am

Спасибо, Евгения!
Я нашёл какой-то иностранный ретранслятор и пробовал так, как Вы посоветовали. В Вашем случае ошибок ретрансляции много больше. Поэтому беру текст, благо у меня много словарей на бумажных носителях, и правлю в ручную. Производительность: 50-150 стр. в сутки. Закончил Левинсон-Лессинга. Заканчиваю Криштановского. Работаю над Горной энциклопедией (кстати, она лучше всего переводится в Word.doc).
С уважением, Гигом.
С уважением, Гигом.

vikrorpert
Сообщения: 10
Зарегистрирован: Сб янв 02, 2010 3:09 pm

Re: Помогите разобраться с .djvu

Сообщение vikrorpert » Пт янв 15, 2010 5:20 am

Viktor писал(а):
Xammer77 писал(а):Это формат изображения! И извлечь текст, как таковой - нереально!


Не надо вводить неискушенных людей в заблуждение: формат djvu прекрасно поддерживает внедренный OCR-слой, с которым можно работать как с обычным текстом (конечно,если при создании djvu-документа он был туда внедрен).
Подробности здесь: http://www.djvu-soft.narod.ru/soft/basic.htm#9 Вопросы №13 и 14


спасибо за ссылку


_______________
бесплатные прокси

Nikolay
Site Admin
Сообщения: 62
Зарегистрирован: Ср июл 05, 2006 12:35 am
Откуда: Геологический факультет МГУ

Re: Помогите разобраться с .djvu

Сообщение Nikolay » Сб авг 10, 2013 7:56 pm

Да, действительно, формат djvu поддерживает OCR-слой... если его туда внедрить. Команда geo.web.ru при сканировании книг его внедряет. Для этого используются FineReader и DJVU OCR. При помощи них можно распознавать и стороннее файлы.

Ответить

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 9 гостей