Помогите разобраться с .djvu
Модератор: catty
Помогите разобраться с .djvu
Есть проблема у не очень уверенного пользователя ПЭВМ. Помогите, пожалуйста.
Скачал .djvu текст на этом сайте. Он прекрасно работает: переводиться и в .pdf и во всякие другие форматы (картинки, фотографии и т.п.); с помощью кнопочек в инструментах (Tools) "выделение текста", "выделение изображения" и "копирование" любой текстовой и рисуночный фрагмент переноситься в любой другой формат любого другого файла (конкретно - в Word файл .doc) и можно дальше работать. Есть, правда, небольшие огрехи с переносом слов, расшифровкой некоторых цифр, иностранных букв и формул, но это легко правиться в файле .doc., т.е. нет особых проблем.
Скопировал другой текст .djvu с других 4 сайтов - одно и тоже: картинки вырезаются, копируются и переносятся в Word файл .doc, а вот текст не выделяется, не копируется и не переноситься, т.к. кнопочки для текста не работают. Перепробовал массу .djvu-программок, взял один и тот же текст с 4 различных сайтов (в т.ч. с официального МГУ), преподробно сравнил все настройки опций .djvu первого текста и второго (не работающего) текста - ничего не получается третьи сутки подряд. Помогите.
С уважением, Гигом.
Скачал .djvu текст на этом сайте. Он прекрасно работает: переводиться и в .pdf и во всякие другие форматы (картинки, фотографии и т.п.); с помощью кнопочек в инструментах (Tools) "выделение текста", "выделение изображения" и "копирование" любой текстовой и рисуночный фрагмент переноситься в любой другой формат любого другого файла (конкретно - в Word файл .doc) и можно дальше работать. Есть, правда, небольшие огрехи с переносом слов, расшифровкой некоторых цифр, иностранных букв и формул, но это легко правиться в файле .doc., т.е. нет особых проблем.
Скопировал другой текст .djvu с других 4 сайтов - одно и тоже: картинки вырезаются, копируются и переносятся в Word файл .doc, а вот текст не выделяется, не копируется и не переноситься, т.к. кнопочки для текста не работают. Перепробовал массу .djvu-программок, взял один и тот же текст с 4 различных сайтов (в т.ч. с официального МГУ), преподробно сравнил все настройки опций .djvu первого текста и второго (не работающего) текста - ничего не получается третьи сутки подряд. Помогите.
С уважением, Гигом.
С уважением, Гигом.
- Павел
- Участник
- Сообщения: 10499
- Зарегистрирован: Пн июн 12, 2006 4:31 pm
- Откуда: г. Красноярск
- Контактная информация:
Re: Помогите разобраться с .djvu
Возможно, в "проблемных" файлах текст не отделён от фона. В этом случае операции с текстом действительно недоступны (текст фактически является рисунком).
Надеюсь, что я ошибаюсь.
Надеюсь, что я ошибаюсь.
Re: Помогите разобраться с .djvu
Спасибо.
Если это так, то как это узнать? И есть ли какие-нибудь "ретрансляторы, редакторы, корректировщики и т.п." - не знаю, как их назвать, которые могут из рисунка сделать текст?
С уважением, Гигом.
Если это так, то как это узнать? И есть ли какие-нибудь "ретрансляторы, редакторы, корректировщики и т.п." - не знаю, как их назвать, которые могут из рисунка сделать текст?
С уважением, Гигом.
С уважением, Гигом.
- Павел
- Участник
- Сообщения: 10499
- Зарегистрирован: Пн июн 12, 2006 4:31 pm
- Откуда: г. Красноярск
- Контактная информация:
Re: Помогите разобраться с .djvu
Как это узнать - не могу сказать. Я же говорю - это гипотеза.
Из рисунка - текст делает, например, "Finereader".
Из рисунка - текст делает, например, "Finereader".
Re: Помогите разобраться с .djvu
Gigom писал(а):Есть проблема у не очень уверенного пользователя ПЭВМ. Помогите, пожалуйста.
Скачал .djvu текст на этом сайте. Он прекрасно работает: переводиться и в .pdf и во всякие другие форматы (картинки, фотографии и т.п.); с помощью кнопочек в инструментах (Tools) "выделение текста", "выделение изображения" и "копирование" любой текстовой и рисуночный фрагмент переноситься в любой другой формат любого другого файла (конкретно - в Word файл .doc) и можно дальше работать. Есть, правда, небольшие огрехи с переносом слов, расшифровкой некоторых цифр, иностранных букв и формул, но это легко правиться в файле .doc., т.е. нет особых проблем.
Скопировал другой текст .djvu с других 4 сайтов - одно и тоже: картинки вырезаются, копируются и переносятся в Word файл .doc, а вот текст не выделяется, не копируется и не переноситься, т.к. кнопочки для текста не работают. Перепробовал массу .djvu-программок, взял один и тот же текст с 4 различных сайтов (в т.ч. с официального МГУ), преподробно сравнил все настройки опций .djvu первого текста и второго (не работающего) текста - ничего не получается третьи сутки подряд. Помогите.
С уважением, Гигом.
Почитатйте здесь http://djvu-inf.narod.ru/.
Это формат изображения! И извлечь текст, как таковой - нереально!
- Павел
- Участник
- Сообщения: 10499
- Зарегистрирован: Пн июн 12, 2006 4:31 pm
- Откуда: г. Красноярск
- Контактная информация:
Re: Помогите разобраться с .djvu
Спасибо за ссылку.
Re: Помогите разобраться с .djvu
Xammer77 писал(а):Это формат изображения! И извлечь текст, как таковой - нереально!
Не надо вводить неискушенных людей в заблуждение: формат djvu прекрасно поддерживает внедренный OCR-слой, с которым можно работать как с обычным текстом (конечно,если при создании djvu-документа он был туда внедрен).
Подробности здесь: http://www.djvu-soft.narod.ru/soft/basic.htm#9 Вопросы №13 и 14
Re: Помогите разобраться с .djvu
Gigom писал(а):Есть проблема у не очень уверенного пользователя ПЭВМ. Помогите, пожалуйста.
Гигом, к сожалению, в вашем случае ничего не получится, так как большинство пользователей ру-нета делают книги (по крайней мере по геологии, за исключением данного ресурса и еще юрасика) в djvu-формате без текстового слоя (того самого, о котором сказал Victor). В Вашем случае книги без этого текстового слоя, поэтому перекинуть текст в doc формат нереально. Единственное, что могу посоветовать - распознайте книгу сами. Самый простой способ для "не очень уверенного пользователя ПЭВМ": перевести страницы книги (Файл-Экспорт страницы) в формат jpeg, а затем распознать с помощью FineReader'a.
Евгения.
Re: Помогите разобраться с .djvu
Спасибо, Евгения!
Я нашёл какой-то иностранный ретранслятор и пробовал так, как Вы посоветовали. В Вашем случае ошибок ретрансляции много больше. Поэтому беру текст, благо у меня много словарей на бумажных носителях, и правлю в ручную. Производительность: 50-150 стр. в сутки. Закончил Левинсон-Лессинга. Заканчиваю Криштановского. Работаю над Горной энциклопедией (кстати, она лучше всего переводится в Word.doc).
С уважением, Гигом.
Я нашёл какой-то иностранный ретранслятор и пробовал так, как Вы посоветовали. В Вашем случае ошибок ретрансляции много больше. Поэтому беру текст, благо у меня много словарей на бумажных носителях, и правлю в ручную. Производительность: 50-150 стр. в сутки. Закончил Левинсон-Лессинга. Заканчиваю Криштановского. Работаю над Горной энциклопедией (кстати, она лучше всего переводится в Word.doc).
С уважением, Гигом.
С уважением, Гигом.
-
- Сообщения: 10
- Зарегистрирован: Сб янв 02, 2010 3:09 pm
Re: Помогите разобраться с .djvu
Viktor писал(а):Xammer77 писал(а):Это формат изображения! И извлечь текст, как таковой - нереально!
Не надо вводить неискушенных людей в заблуждение: формат djvu прекрасно поддерживает внедренный OCR-слой, с которым можно работать как с обычным текстом (конечно,если при создании djvu-документа он был туда внедрен).
Подробности здесь: http://www.djvu-soft.narod.ru/soft/basic.htm#9 Вопросы №13 и 14
спасибо за ссылку
_______________
бесплатные прокси
-
- Site Admin
- Сообщения: 62
- Зарегистрирован: Ср июл 05, 2006 12:35 am
- Откуда: Геологический факультет МГУ
Re: Помогите разобраться с .djvu
Да, действительно, формат djvu поддерживает OCR-слой... если его туда внедрить. Команда geo.web.ru при сканировании книг его внедряет. Для этого используются FineReader и DJVU OCR. При помощи них можно распознавать и стороннее файлы.
Кто сейчас на конференции
Сейчас этот форум просматривают: нет зарегистрированных пользователей и 9 гостей