Как установить finereader на linux
Для Linux имеются разнообразные инструменты командной строки и с графическим интерфейсом для преобразования изображений в текст. В этой статье будут рассмотрены программы, с помощью которых вы можете после сканирования страниц книги или документов перевести их в текстовый формат.
OCR программы в Linux с графическим интерфейсом
OCRFeeder
OCRFeeder — это система анализа макета документов и оптического распознавания символов.
Откройте в этой программе изображения и она автоматически определит контуры областей, в которых находятся изображения и текст и выполнит OCR (распознавание текста) этого документа. Программа может сохранять полученные результаты в разные форматы, главным из них является ODT.
Программа имеет законченный GTK+ графический пользовательский интерфейс, который позволяет пользователям корректировать любые нераспознанные символы, определять или корректировать границы областей текста, устанавливать стили параграфов, очищать введённые изображения, импортировать PDF, сохранять и загружать проект, экспортировать всё в несколько форматов и так далее.
В общем, это программа по функциям схожая с Abbyy FineReader, в некотором смысле, можно сказать, что OCRFeeder это аналог Abbyy FineReader для Linux, по крайней мере, в его базовой функциональности.
В своей работе OCRFeeder использует сторонние движки оптического распознавания символов, например, по умолчанию она использует Tesseract. Для установки нужно установить и графический интерфейс OCRFeeder и Tesseract. В Debian и производных Tesseract устанавливается в качестве зависимости, поэтому необязательно указывать этот пакет явно. Но при этом помните, что вместе с Tesseract устанавливается по умолчанию только распознавание английского языка, для дополнительной поддержки русского, нужно явно указать этот пакет. Про распознавание других языков, а также про работу с Tesseract будет рассказано в этой же статье далее.
Установка OCRFeeder в Ubuntu, Linux Mint, Debian, Kali Linux и их производные:
Установка OCRFeeder в Arch Linux, BlackArch и их производные:
Как пользоваться OCRFeeder
Для запуска программы найдите её в меню (скорее всего, в разделе Офис):
Или в командной строке выполните команду:
Внешний вид программы:
Для анализа у меня есть тестовое изображение:
Загрузим его в программу (для этого нажмите знак плюс +). Вам необязательно добавлять изображения по одному — можно добавлять целыми папками или импортировать PDF документ.
Для распознавания в меню Документ выберем «Распознать документ» (будут распознаны все страницы, которые загружены в программу), либо «Распознать страницу» (будет распознана страница, которая выделена в данный момент).
В правом нижнем углу появляются результаты распознавания текста:
Как видим, результаты не идеальные, но вполне удовлетворительные — после небольшой ручной корректировки, этот текст пригоден для использования.
Как обычно с системами OCR — чем лучше качество исходного текста (имеют значение ровность, размер, контрастность и другое), тем лучше получается результат (хотя в любом случае требуется вычитка и корректировка полученного при распознавании текста):
По умолчанию языком для распознавания установлен тот же язык, что имеет ваша система, то есть, скорее всего, русский язык. Вы можете изменить язык в Меню → Настройки → Распознавание → Default language. Если вы выбрали неверный язык, то движок оптического распознавания символов вернёт плохие результаты. Если вы выбрали язык, который не поддерживается движком, то он может вернуть пустую страницу.
Вы можете экспортировать для распознавания PDF документы. А полученные результаты сохранять в различных форматах:
Также вы можете сохранить весь проект целиком в собственном формате программы.
Если вы запускаете OCRFeeder из командной строки, то вы можете использовать несколько опций для ускорения процесса добавления изображений.
gImageReader
gImageReader — это графический GTK+ интерфейс для tesseract-ocr.
Tesseract — пожалуй, самое точное программное обеспечение с открытым исходным кодом для оптического распознавания символов (OCR) и может распознавать текст на более чем 60 языках.
gImageReader поддерживает автоматическое определение макета страницы, но пользователь также может вручную задать и отредактировать области распознавания. Есть возможность импортировать изображения с диска, устройств сканирования, буфера обмена и скриншотов. gImageReader также поддерживает многостраничные документы PDF. Распознанный текст отображается непосредственно рядом с изображением и базовое редактирование текста включает поиск/замену и удаление сломанных строк если это возможно. Также поддерживается проверка орфографии для выводимого текста если установлены соответствующие словари.
- Импорт PDF документов и изображений с диска, сканирующих устройств, буфера обмена и скриншотов
- Обработка нескольких изображений и документов за один проход
- Ручное или автоматическое определение области распознавания
- Распознавание в простой текст или в документ hOCR
- Распознанный текст отображается рядом с исходным изображением
- Последующая обработка текста, включая проверку орфографии
- Геренирование PDF документов из hOCR документов
Установка OCRFeeder в Ubuntu, Linux Mint, Debian, Kali Linux и их производные:
Установка OCRFeeder в Arch Linux, BlackArch и их производные:
ocrgui
ocrgui — это графический интерфейс для OCR программ (Tesseract, GOCR). Программа давно не обновлялась и может отсутствовать в стандартных репозиториях.
Установка OCRFeeder в Arch Linux, BlackArch и их производные:
screentranslator
Это экранный переводчик, программа захватывает область экрана, распознаёт текст и выполняет его перевод. Если вам не нужен перевод, то его можно отключить.
Установка OCRFeeder в Arch Linux, BlackArch и их производные:
В настройках укажите путь к tesseract: /usr/bin/tesseract
Утилиты командной строки для OCR
Далее будут рассмотрены движки оптического распознавания символов, которые имеют интерфейс командной строки. Эта информация может пригодиться продвинутым пользователям, привыкшим иметь дело с консолью, а также пользователям OCRFeeder, поскольку эта программа умеет работать с каждым из рассмотренных ниже OCR инструментов, и знание их особенностей и различий помогут вам правильно выбрать используемый движок OCR:
Tesseract
Tesseract — это движок оптического распознавания символов (OCR) с открытым исходным кодом. Его можно использовать напрямую, с помощью API для извлечения печатного текста из изображений, а также программы с графическим интерфейсом, такие как OCRFeeder, могут использовать Tesseract. Этот движок поддерживает большое количество языков. Пакет включает в себя утилиту командной строки.
Обратите внимание на опцию -l, после которой нужно указать используемый язык. Если он не указан, то подразумевается английский. Можно указать несколько языков, разделённых знаком плюс. Tesseract использует 3-символьные коды языков ISO 639-2.
Доступны следующие языки:
Ocrad
Ocrad включает анализатор разметки, способный разделять столбцы или блоки текста, какие обычно бывают на печатных страницах.
Для лучшего результата символы должны быть по крайней мере 20 пикселей в высоту. Если они меньше, попробуйте опцию --scale. Сканированные изображения на 300 dpi обычно дают размер символов достаточно хорошего размера для ocrad.
Слитые, очень смелые или очень светлые (сломанные) символы обычно не распознаются правильно. Старайтесь избегать их.
Если файлы не указаны, то ocrad считывает изображения из стандартного ввода. Если опция -o не указана, ocrad отправляет текст в стандартный вывод.
Статусы выхода: 0 для нормального выхода, 1 при проблемах в среде (файл не найден, неверные флаги, ошибки ввода/вывода и т.д.), 2 говорит о повреждённом или неверном файле ввода, 3 для ошибки внутренней консистенции (например, баг), которая вызвала панику в ocrad.
gocr — это мультиплатформенная программа распознавания текстов (OCR). Она принимает файлы изображений pnm, pbm, pgm, ppm, some pcx и tga. В настоящее время программа должна быть способна хорошо работать со сканами, в которых есть текст в один столбец и нет таблиц. Поддерживается размер шрифта от 20 до 60 пикселей.
Опции (больше подробностей в мануале man gocr):
Провести анализ разметки:
Расширенная база данных:
Использовать файл jpeg переданный по трубе:
Cuneiform
Cuneiform — это многоязычная система OCR (распознавания текста). В дополнении к распознаванию текста, она также анализирует разметку и распознаёт формат текста.
Поддерживаются следующие языки: болгарский, хорватский, чешский, датский, голландский, английский, эстонский, французский, немецкий, венгерский, итальянский, латышский, литовский, польский, португальский, румынский, русский, сербский, словенский, испанский, шведский, турецкий и украинский.
--dotmatrix
Режим распознавания оптимизирован для текстов, напечатанных на принтерах с точечной матрицей
--fax
Использовать режим распознавания, оптимизированный для текстов, переданных по факсу.
--singlecolumn
Отключить анализ разметки страницы и исходить из того, что изображение состоит из одной колонки текста.
-f формат
Выбрать формат вывода. Доступны следующие форматы:
- html (HTML формат),
- hocr (hOCR HTML формат),
- native (родной формат Cuneiform 2000),
- rtf (RTF формат),
- smarttext (простой текст с TeX параграфами),
- text (простой текст).
По умолчанию это plain text.
-l язык
По умолчанию Cuneiform распознаёт английский текст. Для изменения языка используйте переключатель командной строки, после -l после которого следует код языка (обычно трёхбуквенный код ISO 639-2).
Поддерживаются следующие языки:
-o вывод
Если вы не указали файл вывода с переключателем -o, то Cuneiform запишет результаты в файл ‘cuneiform-out.format’. Расширение файла зависит от вашего формата вывода.
Форматы ввода
Cuneiform может обрабатывать любые изображения с единичной страницой, которые GraphicsMagick знает как открывать. Посмотрите мануала gm(1) для полного списка поддерживаемых форматов изображений.
ocropy
ocropy — это написанный на Python OCR пакет, использующий рекуррентные нейронные сети (ранее назывался OCRopus).
ocropy — это коллекция программ для анализа документов, это не простая OCR система, которая распознаёт тексты в графическом интерфейсе или с запуском одной команды. Функции ocropy разбиты на отдельные модули и, например, для простого распознавания текста может потребоваться ввести несколько команд для подготовки документа.
В дополнении к самим скриптам распознавания, имеется ряд скриптов для базового редактирования и коррекции, измерению процента ошибок, определению матриц путаницы и т. п.
Finereader 7 Pro под Wine (Установка (пока что))
Вопросы настройки, запуск любых Windows-программ, кроме игрFinereader 7 Pro под Wine
Пытался установить FineFeaderrr 7 Pro под Wine 0.9.20. Во время установки мне выдаетПод wine@etersoft заводится полпинка. Только один глюк (что под цшту что под кросовер 5) - при старте пропадают панельки сканирования, форматирования, приходится их в ручную выставлять.
ЗЫ Под обычным вайном инсталятор будет требовать установленного ie (покрайней мере ФР6 требовал)
я устанавливал fine reader 8 под Wine. Сначала надо установить триальную версию, а уже потом поверх её полную.The ABBYY FineReader Engine 6.0 for Linux is a Software Development Kit (SDK) for integrating ABBYY recognition technologies into Linux applications.
Родного нету. А движок денег стоит.
Дети любят тигра больше, чем Пржевальский лошадей. © Тимур Шаов.
Топик не читал, но внимательно просмотрел.
Под linux нормальной распознавалки нет, а для русского йазыка и не будет видимо.
под wine 0.9.37 FR8 заводиться замечательно, только есть бага одна - когда выбираю много фоток в диалоге, FR просто виснет А в выводе ничего интересного нет? У меня восьмой FR на wine-0.9.42 встал нормально (тоже правда скачал модуль gecko), вроде работает. И кстати откуда там MSI?сначала файлик разорхивируется в c:\temp\bla-bla-bla. потом тихо. захожу туда, запускаю wine setup.exe, ничо не происходит и в консоль не валится. Там же есть файлик ABBYY FineReader 8.0 Professional Edition.msi Если в винде на него ткнуть, должна начаться установка, вроде как ))))
тока что попробовал в федоре, та же хрень. может диск другой установочный поискать ))
сначала файлик разорхивируется в c:\temp\bla-bla-bla. потом тихо. захожу туда, запускаю wine setup.exe, ничо не происходит и в консоль не валится. Там же есть файлик ABBYY FineReader 8.0 Professional Edition.msi Если в винде на него ткнуть, должна начаться установка, вроде как ))))
тока что попробовал в федоре, та же хрень. может диск другой установочный поискать ))
такая ж хрень - (
Пробовал скопировать с винды установленный FR8 - нормально запускается. но при попытке добавления изображения для сканирования ругается на неправильные пути ((((((
сначала файлик разорхивируется в c:\temp\bla-bla-bla. потом тихо. захожу туда, запускаю wine setup.exe, ничо не происходит и в консоль не валится. Там же есть файлик ABBYY FineReader 8.0 Professional Edition.msi Если в винде на него ткнуть, должна начаться установка, вроде как ))))
тока что попробовал в федоре, та же хрень. может диск другой установочный поискать ))
такая ж хрень - (
Пробовал скопировать с винды установленный FR8 - нормально запускается. но при попытке добавления изображения для сканирования ругается на неправильные пути ((((((
Разобрался - скопировал с винды вайн - и в winecfg - прописл к нему путь - и заработало ))))))
FineReader — система оптического распознавания символов разрабатываемая российской компанией ABBYY.
ABBYY FineReader for Linux — коммерческое приложение для конвертирования сканированных изображений документов или PDF файлов в редактируемые электронные форматы.
ABBYY FineReader for Linux консольная утилита распознавания и " движок " (набор подключаемых библиотек) распознавания для встраивания в различные корпоративные системы документооборота и др.
ABBYY FineReader for Linux использует интеллектуальную систему оптического распознавания OCR (Optical Character Recognition) и собственную технологию распознавания позволяющую точно распознавать документы и точно воссоздать документы со сложным форматированием.
Полная версия ABBYY FineReader for Linux стоит около 150€, но на сайте проекта имеется так же и демоверсия позволяющая распознать 100 страниц (после регистрации на сайте и получения серийного номера для демоверсии) . Установка ABBYY FineReader for Linux сводится к запуску (от администратора / root) бинарного файла (./abbyyocr.bin) из архива скачанного с сайта проекта и введение во время установки серийного номера.
ABBYY FineReader for Linux поддерживает распознавание текста (полное и частичное) на более чем двухстах языках. Имеет множество опций командной строки для гибкой настройки параметров распознавания.
Для сохранения результатов распознавания в ABBYY FineReader for Linux используются коммерческие (проприетарные) ыорматы хранения текстовых документов, основной формат сохранения RTF (Rich Text Format) .
Команда для запуска распознавания выглядит так:
ABBYY FineReader for Linux имеет встроенную справочную систему, в HTML формате на английском языке, содержащей описание, и сведения о лицензировании и активации.
Используя бесплатный аналог ABBYY FineReader вы экономите 3590 рублей.
img2txt
img2txt - онлайн сервис по распознаванию текстов из отсканированных изображений. Сервис работает с английским, русским и украинским языками. Стоит отметить, что загружаемое изображение не должно содержать таблицы, изображения, диаграммы, а также превышать 4 Мб. Кроме того, оно должно быть представлено в одном из следующих форматов: jpg, jpeg, png. подробнее.
Free Online OCR
Free Online OCR - бесплатный онлайн сервис для распознавания текста. К достоинствам аналога ABBYY FineReader можно отнести хорошее качество распознавания текста; неограниченное количество загрузок; работа с 70 языками, в том числе русским; распознавание текста, содержащего сразу несколько языков; отсутствие регистрации. Free Online OCR предоставляет возможность выделять, а также разворачивать часть документа, предназначенную для дальнейшей обработки. Распознает следующие форматы: JPEG, JFIF, PNG, GIF, BMP, PBM, PGM, PPM и PCX. Работает с такими форматами сжатия как Unix compress, bzip2, bzip и gzip; со следующими мультистраничными документами: TIFF, PDF и DjVu. Распознает файлы DOCX и ODT с изображениями. Работает с ZIP архивами. Результат может быть получен в виде простого текста (TXT), документа Microsoft Word (DOC) и PDF-файла Adobe Acrobat. подробнее.
SimpleOCR
SimpleOCR - бесплатное приложение для распознавания текста. Умеет распознавать рукописный текст. Поддерживаемые языки: английский, голландский, французский. Умеет читать изображения со сканера. подробнее.
Читайте также: