Abbyy finereader 11 что это за программа
Пожалуй, трудно в IT-сфере найти человека, ничего не слышавшего о программных решениях отечественной компании ABBYY, входящей в ТОП-100 самых упоминаемых брендов Рунета и являющейся законодателем мод в области распознавания документов и лингвистики. Более чем двадцатилетний опыт насыщенной и продуктивной работы определил успех российского разработчика во всем мире, о чем свидетельствует не только 30-миллионная аудитория пользователей более чем в 130 странах, но и признание со стороны бизнес-сообщества, обрабатывающего с помощью технологий и инструментов компании свыше 1,6 млрд страниц документов и форм ежегодно. Цифры впечатляющие, однако в ABBYY не почивают на лаврах и продолжают неустанно из года в год совершенствовать и расширять линейку своей продукции, не так давно пополнившуюся новой, одиннадцатой по счету версией OCR-пакета FineReader, представленного в редакциях Professional Edition и Corporate Edition и предназначенного для конвертирования отсканированных документов, изображений, фотографий и PDF-файлов в редактируемые форматы.
Говоря о нововведениях в систему оптического распознавания текстов, прежде всего следует отметить увеличенную скорость обработки документов. По результатам проведенных ABBYY тестов, FineReader 11 демонстрирует возросшую на 20% производительность по сравнению с предыдущей версией продукта. Особый акцент разработчики делают на оптимизации различных режимов работы приложения, позволяющих добиваться существенной экономии времени при обработке больших объемов информации. Так, практическое использование нового черно-белого режима ускоряет конвертирование данных до 30%, а активация режима быстрого распознавания, предназначенного для документов с простым оформлением и хорошим качеством печати, форсирует упомянутый процесс аж до 70%. Немалую роль в достижении программой столь значимых результатов играет эффективное использование вычислительных возможностей многоядерных процессоров.
Вторая ключевая особенность FineReader 11 — улучшенное качество распознавания и сохранения структуры многостраничных документов. Благодаря совершенствованию технологии адаптивного распознавания документов (ADRT — Adaptive Document Recognition Technology), специалистам ABBYY удалось на 40% повысить точность определения заголовков и колонтитулов, на 70% — текста на полях, на 25% улучшить распознавание таблиц и на 15% — определение картинок и диаграмм. Также добавлена поддержка вертикальных колонтитулов, улучшено на 20% качество "понимания" текстов для группы языков CJK (китайский, японский, корейский) и в состав программы включен инструментарий для создания в PDF-документе оглавления в виде закладок. Использование последней опции восстанавливает структуру оглавления документа с возможностью перехода по ссылкам, что существенно упрощает навигацию и работу с многостраничными материалами.
Важный аспект — поддержка языков, также не оставшаяся без внимания программистов, инженеров и лингвистов ABBYY. Разработчики добавили в одиннадцатую сборку продукта арабский, вьетнамский, туркменский (латиница) языки и реализовали словарную поддержку для арабского, вьетнамского, латинского, японского, корейского языков. Таким образом, отныне в активе OCR-решения значится 189 языков распознавания, для 45 из которых предусмотрена проверка орфографии. Такой багаж знаний делает FineReader самой многоязычной системой распознавания в мире.
Вполне возможно, что рядовым пользователям FineReader, чья работа с приложением ограничивается конвертированием документов на двух-трех европейских языках, включение поддержки перечисленных в предыдущем абзаце языков покажется малозначительным, однако на деле умение программы понимать особенности той же арабской системы письма свидетельствует о том, что технологии оптического распознавания ABBYY развиваются, а значит, становятся еще совершеннее. Важно осознавать, что за реализацией поддержки любого дополнительного языка кроется кропотливый труд большого числа специалистов и экспертов компании.
Отдельное внимание при разработке программы было уделено переводу бумажных книг в цифровой вид. Электронные книги давно уже превратились из экзотики в обыденность, поэтому включение в состав FineReader 11 поддержки форматов FictionBook 2.0 (FB2), Electronic Publication (ePub) и возможности отправлять файлы непосредственно из окна приложения в учетную запись Amazon Kindle является оправданным шагом. В настройках модуля, отвечающего за формирование eBook-изданий, можно управлять функцией сохранения изображений и их качеством, выбирать оформление книги с использованием простого или форматированного текста, включать встраивание шрифтов и манипулировать прочими свойствами документа. Кроме того, программа умеет автоматически сохранять главы книги в отдельные HTML-файлы и восстанавливать ссылки в содержании на соответствующие главы книги. Данная возможность FineReader также может быть востребована владельцами eBook-ридеров и прочих портативных устройств.
Серьезно изменились средства обработки фотографий, пополнившиеся новыми инструментами для редактирования изображений, включая настройку яркости, контрастности и уровней интенсивности света и тени, которая позволяет значительно улучшить исходные снимки и получить более точные результаты распознавания. Подобного рода корректировки можно произвести в любом имеющемся под рукой графическом редакторе, однако одно дело — возиться со сторонним приложением и затем переносить файлы в FineReader, и совсем другое — вносить необходимые правки непосредственно в окне OCR-пакета.
Упомянуть следует и появившийся в 10-й версии программы и улучшенный в 11-й инструментарий для исправления трапециевидных искажений, часто возникающих при съемке документов цифровой камерой. Выбрав в редакторе изображений соответствующий пункт, пользователь может, перетаскивая мышью углы рамки и совмещая их с углами картинки, устранить искажение перспективы и в два счета привести снимок к «плоскому» виду. Подобный функционал может быть полезен как для улучшения читабельности сфотографированных документов, так и для приведения разнородных снимков к общему знаменателю.
. и после коррекции трапеции средствами FineReader 11
ABBYY FineReader предоставляет широкий спектр возможностей для работы с форматом PDF — принятым во всем мире стандартом обмена электронными документами и деловой переписки. В обновленной редакции продукта улучшена технология MRC-сжатия (Mixed Raster Content), благодаря чему можно уменьшить размеры PDF-файлов в пять раз, по сравнению с 10-й версией программы, без видимых изменений качества изображения — это позволяет экономить пространство на диске компьютера и пересылать объемные документы по электронной почте. Три новых режима сохранения PDF — «Высокое качество», «Небольшой размер», «Сбалансированный режим» — позволяют пользователю получать оптимальные результаты для разного типа задач.
Претерпели изменения в FineReader 11 также средства редактирования и проверки документов. Из наиболее значимых новшеств можно отметить механизм разделения пакета страниц на несколько документов. Данная функция может быть полезна при сканировании в едином потоке разнородных материалов (газетные вырезки, журнальные статьи, сканы книжных страниц и так далее), для каждого из которых необходимо использовать различные настройки OCR-движка. Сортировка осуществляется простым перетягиванием мышью миниатюр страниц в окне «Разделить документ на несколько» и последующим нажатием клавиши «Создать» (см. скриншот). В результате для каждого набора страниц запустятся отдельные копии FineReader с независимыми друг от друга параметрами распознавания текстов.
Брызги нововведений затронули также инструментарий для проверки неуверенно распознанных и отсутствующих в словарной базе слов, редактор стилей с функцией объединения стилей со схожими атрибутами и диалоговое окно «Задачи», обеспечивающее мгновенный доступ ко всем базовым и пользовательским сценариям работы. Кроме того, в FineReader 11 появилась возможность изменять нумерацию страниц в книгах с обратной нумерацией и восстанавливать оную при двустороннем сканировании документов.
Таковы основные изменения одиннадцатой линейки FineReader, обзор которой был бы неполным без упоминания особенностей корпоративной сборки продукта, включающей все возможности Professional-редакции и имеющей ряд дополнительных инструментов для удобства совместной работы в сети (например на одном компьютере можно сканировать документы, на другом — распознавать, а на третьем — проверять результаты). Кроме того, версия Corporate Edition предусматривает возможность автоматизированной установки программы на вычислительные машины в локальной сети и централизованное управление лицензиями.
Акцентируя внимание на новшествах FineReader 11 Corporate Edition, прежде всего следует отметить расширенное стартовое окно «Задачи» и возможность создания пользователем собственных сценариев работы программы. Если в профессиональной редакции OCR-пакета список «однокликовых» операций строго регламентирован, то в корпоративной версии его можно всячески варьировать, гибко настраивая и автоматизируя работу FineReader. Важной особенностью приложения является возможность использования сценариев, созданных другими пользователями, и наличие в составе продукта планировщика Hot Folder, также подвергшегося дальнейшим улучшениям и доработкам.
Настраиваемые сценарии FineReader 11 Corporate Edition
Менеджер задач с функциями экспорта/импорта сценариев
Следуя новым техническим и организационным веяниям в области информационной безопасности, разработчики ABBYY оснастили текстовый редактор программы средствами цензурирования документов. Основная функция новинки заключается в защите конфиденциальных данных от посторонних глаз: с помощью специального маркер, пользователь может замазать черными полосами секретный текст и сделать его недоступным для просмотра и копирования. Функция поддерживается при сохранении документа в PDF-файл, а также в других форматах.
Что касается предъявляемых одиннадцатой версией FineReader системных требований, то они практически не изменились. Для корректной работы пакета необходим функционирующий под управлением Windows компьютер с тактовой частотой процессора 1 ГГц или выше и объемом оперативной памяти не менее одного гигабайта. Программа работает со всеми популярными моделями сканеров и многофункциональных устройств (МФУ), в том числе с цифровыми фотокамерами и камерами мобильных телефонов с разрешением свыше двух мегапикселей и функцией автофокуса.
Как мы уже сказали, в новом FineReader блоки разных типов определяются более точно – это помогает правильнее «собирать» строки текста. Например, прошлая версия иногда впадала в ступор, видя ультра-модную вёрстку книжек с «авторскими заметками на полях»:
В результате такого выделения программа считала, что строки из второй колонки – это продолжение строк из первой, и текст выстраивался неправильно.
Теперь мы знаем о существовании таких книг и сообщили об этом нашему детищу. В результате блоки выделяются правильно.
Кстати, на приведённых изображениях видно ещё одно продвижение FineReader’а на пути к совершенству – таблицы стали лучше разбиваться на ячейки. В среднем по сравнению с десятой версией количество ошибок разбиения таблиц на ячейки уменьшилось на 25%. Кроме того, ошибок при определении колонтитулов стало меньше на 40%, а картинки и диаграммы «находятся» лучше на 15%. Впрочем, вопрос, как измерять количество ошибок анализа, – довольно тонкий и, возможно, заслужит отдельного внимания. А с таблицами-то всё ясно – мы одной ошибкой считаем или разбиение ячейки на две, или наоборот, объединение двух ячеек в одну.
Что ещё? Более стабильной стала работа с большими (более 100 файлов) пакетами документов. Теперь они обрабатываются с такой же скоростью, что и отдельные документы.
Изменения коснулись и обработки сфотографированных документов: лучше работает автоматическое исправление искажений. Кроме того, появился обновленный редактор изображений – в нём можно вручную скорректировать яркость, контрастность, уровни интенсивности света и тени или устранить трапециевидные искажения.
Улучшилась работа с многостраничными документами – теперь распознанные страницы лучше собираются в единый документ, в котором меньше ненужных делений на секции. Новая версия FineReader правильно определяет размер полей и позиционирование колонтитулов – это позволяет сохранять форматирование при экспорте в формат RTF.
Изменения коснулись и экспорта в PDF. Для разного типа задач можно использовать три новых режима сохранения – «Наилучшее качество», «Небольшой размер» и «Сбалансированный режим». Эти режимы задают параметры сохранения изображений, которые будут в вашем PDF. Первый режим понадобится вам, если вы хотите, чтобы картинки были высокого качества. Программа сохранит их с разрешением 300 dpi, при сжатии будут использованы форматы без потери качества ZIP, LZW, а также JPEG и J2K с параметром качества 80. Черно-белые изображения обрабатываются при помощи CCITT4 и JBIG2. Второй режим, «Небольшой размер» имеет смысл использовать, если вы сохраняете файл для архива или в других случаях, если важно сэкономить на весе файла. PDF сжат настолько, насколько это возможно при сохранении читаемости документа. Разрешение изображений здесь будет уже 150 dpi, параметр качества JPEG – 50. «Сбалансированный режим» – это своеобразный компромисс между качеством и размером файла: разрешение 300 dpi, параметр качества JPEG – 60. Что касается технологического аспекта, улучшена технология сжатия MRC (о ней мы писали здесь).
Ещё FineReader 11 умеет преобразовать бумажные книги в электронные: теперь доступно сохранение результатов распознавания не только в HTML (как это было в «десятке»), но и в форматы Electronic Publication (.ePub) and FictionBook (.fb2), оптимизированные для смартфонов, электронных книг и планшетных компьютеров. Причём сценарий создания электронных книг вынесен в окно «Новая задача», которое появляется при старте программы.
Усовершенствован редактор стилей документа. Теперь настраивать все параметры стилей можно в одном диалоге, а изменения происходят сразу во всем документе.
Изменения коснулись и интерфейса. В окно «Новая задача» вынесены функции, которые бывают нужны чаще всего. Кроме того, в Corporate Edition интерфейс можно настроить под себя, добавляя новые сценарии или импортируя созданные другими пользователями.
Если вы очень торопитесь и хотите распознать документ максимально быстро, можно использовать ещё одну новую функцию – чёрно-белый режим распознавания.
Разумеется, в этом случае за скорость придётся заплатить возможной потерей качества, но мы постарались сделать так, чтобы цена не была слишком высокой.
Всё описанное выше, кроме изменений функций в окне «Новая задача», относится к двум версиям – ABBYY FineReader 11 Professional Edition и ABBYY FineReader 11 Corporate Edition. В корпоративной версии в режиме редактирования можно применить функцию удаления конфиденциальной информации – она помечается и при экспорте удаляется.
Для пользователей корпоративной версии мы подготовили ещё и бонус – программу ABBYY Business Card Reader. Многие из вас уже знакомы с мобильной версией этой программы, теперь она переехала и на десктоп. Отсканировать визитку и загрузить данные в Microsoft Outlook с распределением данных контакта по соответствующим полям можно одной кнопкой, используя предопределенный сценарий работы. Конечно, если необходимо, данные можно проверить и отредактировать.
Отдельно хочется сказать о работе с языками. У нас наконец-то появилось распознавание арабского языка, причём качество – на уровне конкурентов, а то и выше. Арабский OCR клиенты у нас давно просили, так что получите – распишитесь. Кроме этого, FineReader научился распознавать туркменский (латиница) и вьетнамский. Появилась словарная поддержка для арабского, вьетнамского, японского, двух вариантов корейского и латыни.
Ещё мы стали быстрее распознавать документы на некоторых азиатских языках: скорость распознавания корейского увеличилась аж на 30% без потери в качестве, японского – на 10%. Наши ребята довольно долго отслеживали, «тонкие места» с помощью разных профайлеров (помимо доморощенных счётчиков-таймеров использовались интеловский VTune и AQTime от AutomatedQA Corp). Такого, чтобы магическим взглядом найти место в коде, которое можно переписать и впятеро ускорить программу у нас по счастью не случалось, а про неделю потраченного времени и ускорение на два процента писать как-то не с руки, так что оставим тему, что там поменяли.
Мы рассказали вам об основных изменениях в новой версии FineReader, которую уже сейчас можно купить в нашем магазине. Хотите узнать больше — читайте подробнее на сайте ABBYY.
Ну а если вы хотите попробовать новый FineReader и написать о нем обзор, обозначьтесь в комментах – и мы выдадим вам промо-код. Их у нас три штуки!
Трое желающих написать обзор уже отметилось в комментариях. Скоро на Хабре!
ABBYY FineReader 11 – это профессиональный инструмент, позволяющий за небольшое время распознать огромный объем текста, прямо из сканов и картинок. Для того чтобы разобраться с тем, что это за программа потребуется изучить ее интерфейс и ознакомиться с ее функционалом и возможностями. Стоит отметить, что в конце статьи есть ссылки на загрузку установщика, которому не требуется активация. Программа не будет запрашивать ключик активации, а сразу же начнет работать в полноценном режиме.
Возможности программы
FineReader 11 достаточно сильно упрощает работу с распечатанными и отсканированными документами, так как их без проблем можно подредактировать. К тому же если вдруг возникает необходимость можно распознать текст прямо с экрана монитора, сделав скриншот и открыв его в приложении.
Если не знаете чем открыть файл, воспользуйтесь торрент клиентом ниже.
Интерфейс программы
Так как Repack на русском не придется устанавливать дополнительно русификаторов. К тому же не потребуется и активация, потому как она уже вшита в установщик. После запуска открывается окно приветствия, в котором можно выбрать режимы работы:
Можно распознавать сразу в файл MS Word:
Также есть и другие форматы:
Вверху есть меню. Первый раздел его позволяет работать с документами, открывать их, сохранять и так далее:
Раздел «Вид» нужен для настройки окна:
«Документ» поможет работать со сканами и картинками. Распознавать их:
Следующий же раздел нужен для редактирования страницы:
Для работы с картинками также существует и следующий раздел. Он позволит выбирать области с текстом и изображениями вручную:
Раздел «Сервис» поможет работать с уже распознанным текстом:
«Справка» необходима для получения всей подробной информации о софте:
После загрузки документа, приложение автоматически распознает его. Немного выше располагаются все инструменты для работы:
Далее само изображение и распознанный, отформатированный текст:
В левой части будут собраны все страницы документа:
Настройки программы
Если перейти к параметрам, то вы сразу же попадаете к основным настройка программы:
Следующий раздел позволяет настроить сканирование и открытие документов:
Следом за ним параметры распознавания:
А сразу же после них — параметры сохранения документов:
Вкладка «Вид» позволит настроить окно программы:
«Дополнительные» параметры необходимы для настройки остальных параметров интерфейса, проверки и самой программы:
Данный софт часто просто критически необходим. В жизни существуют различные ситуации, в которых требуется распознавать печатный текст в больших объемах. Многие до сих пор вручную перепечатывают его вручную, что занимает огромное количество времени. Поэтому предлагается скачать FineReader 11 professional edition по ссылкам ниже, при помощи торрента или прямо с сайта:
ABBYY FineReader на руссском языке идеально подходит тем, кто работает с текстами, которые были сфотографированы, а также старыми печатными изданиями после оцифровки. Даже если понадобится перевести конспект в электронный вид, это программа тоже очень поможет. Производителем софта является российская компания ABBYY. С 2009 года эта программа постоянно удостаивается различных международных наград и премий.
Особенности программы
Abby FineReader – это специальная утилита, которая используется для сканированных бумажных документов и дальнейшего распознавания текста. Программа использует в работе передовые технологические решения по распознаванию и содержит почти 200 словарей на разных языках, которые используют латиницу, кириллицу, а также арабские, армянские знаки, иероглифы.
Программа имеет такие особенности:
- сканирование. Утилита считывает данные со сканера, который подключен;
- технология OCR. Она помогает качественно оцифровывать символы с разных языков. Благодаря этой технологии достигается высокая точность распознавания символов – до 99%. К тому же используется система обучения самой программы, благодаря которой улучшается, совершенствуется распознавание, а его качество возрастает;
- мультиформатность. Данные с бумажного носителя преобразуются в файлы DOC, XLS, PDF и пр. Количество файлов для сохранения варьируется (до 19 штук). То же самое касается и входных файлов;
- программа предлагается в трех редакциях: Standard, Business и Enterprise;
- возможность конвертировать как весь документ, так и отдельные страницы;
- производительность. Происходит автоматическая обработка данных с применением всех ядер CPU. Благодаря этому скорость работы очень высокая. Чтобы распознать одну страницу уходит максимум 15 секунд;
- сравнение. В двух разных документах с помощью этой программы можно выявить отличия;
- простой интерфейс. Он выполнен на русском языке и интуитивно понятен любому.
Таким образом, утилита дает возможность качество и быстро получить текст со сфотографированного или отсканированного документа, при этом, не изменяя последовательность страниц и структуру текста. Получаемый файл можно сохранить в разных форматах, просматривать его, редактировать при необходимости, искать в его содержимом необходимую информацию, а также прикреплять документ к электронным письмам.
Хватит гуглить ответы на профессиональные вопросы! Доверьте их экспертам «Клерка». Завалите лучших экспертов своими вопросами, они это любят!
Читайте также: