Abbyy finereader сравнение документов
Новый FineReader 14 можно сравнить со швейцарским ножом — теперь под его личиной кроются сразу четыре продукта именитого разработчика, объединённых в одну программу с единым рабочим окружением. Помимо успевшей зарекомендовать себя с наилучшей стороны системы оптического распознавания текста Optical Character Recognition (OCR), которая обеспечивает конвертирование отсканированных изображений, фотографий, документов или PDF-файлов в редактируемые электронные форматы, в составе программы представлены редактор PDF, инструмент «Сравнение документов» для сравнения документов различных форматов, включая бумажные и электронные, а также средства автоматизации задач по конвертации документов Hot Folder. Вряд ли кто-то мог предполагать, что в почти четвертьвековой истории развития FineReader (первая версия продукта увидела свет в 1993 году) случится такой крутой поворот, однако в ABBYY убеждены в правильности выбранного курса и уверены, что подобного рода перемены сделают программу ещё более востребованной в пользовательской среде.
Новая концепция FineReader 14
Своё стремление уйти от устоявшихся традиций в компании объясняют современными тенденциями развития рынка электронного документооборота. Согласно проведённым ABBYY исследованиям, сотрудники различных организаций регулярно сталкиваются со следующими сценариями работы с документами: преобразование изображений и PDF-файлов в редактируемые форматы и внесение в них правок; сравнение документов разных форматов; создание, просмотр и редактирование PDF-файлов, а также извлечение из них данных. При этом типичный пользователь имеет дело с четырьмя и более сценариями и для решения каждой задачи использует разные программные продукты. В результате получается так, что вместо того, чтобы выполнять свою задачу, сотрудник компании занимается тем, что изучает эти инструменты и переключается между ними в процессе работы. Это очень неудобно и, по сути, является бесполезной тратой ресурсов, правильно распорядиться которыми должен новый FineReader 14.
ABBYY FineReader 14 предоставляет широкий спектр возможностей в одной программе
Не остались без изменений в обновлённом FineReader и фирменные технологии оптического распознавания текста ABBYY OCR и обработки структуры документа Adaptive Document Recognition Technology. Приложение определяет расположение текста, тип и размер шрифта, начертание и другие особенности форматирования, а также воссоздаёт структурные элементы — таблицы и диаграммы, колонки, заголовки, сноски, колонтитулы, номера страниц. В результате пользователь получает электронную копию документа, идентичную оригиналу. Распознанный текст можно сохранить как текстовый документ (DOCX, ODT, RTF), электронную таблицу (XLSX), презентацию (PPTX), файл HTML, электронную книгу (ePub и FB2), а также в форматах PDF и PDF/A.
Профессиональные инструменты для распознавания текста
С помощью встроенного в программу редактора пользователь может сравнить в одном окне оригинальный документ и распознанную копию. Расширенные функции по редактированию позволяют корректировать форматирование документа, вносить правки в текст, редактировать изображения, искать информацию, управлять страницами документа. Кроме того, имеется возможность вручную задавать области для распознавания и даже научить программу распознаванию специфических шрифтов.
В четырнадцатую версию FineReader были добавлены новые языки распознавания: математические символы (для распознавания однострочных математических формул) и английская транскрипция. Таким образом, теперь программа умеет оперировать документами на 192 мировых языках и любых их комбинациях.
Также при подготовке FineReader 14 к выпуску специалисты ABBYY увеличили скорость обработки и точность распознавания документов, доработали средства конвертирования PDF-файлов с текстовым слоем, улучшили работу с таблицами, графиками, диаграммами и документами на арабском языке. Множеству доработок подверглись другие компоненты программного комплекса. В частности, теперь FineReader позволяет создавать PDF-документы из файлов различных редактируемых форматов (DOCX, XLSX, RTF и др.) и объединять их в один PDF-документ.
Самый важный компонент нового FineReader – PDF-редактор, построенный на базе программы ABBYY PDF Transformer+. Приложение позволяет выполнять рецензирование и согласование PDF-документов, а также предлагает полный набор функций для их защиты от несанкционированного доступа и изменений. Кроме того, приложение интегрировано с Adobe PDF Library , что обеспечивает гарантированное открытие любых PDF -файлов и возможность внесения в них изменений без преобразования в редактируемый формат. С прицелом на корпоративный сегмент рынка в программе предусмотрены инструменты удаления конфиденциальной информации, добавления цифровой подписи и разграничения прав на печать и редактирование документов.
Внесение изменений в текст PDF-документов
FineReader 14 позволяет преобразовывать PDF в популярные форматы Microsoft Word, Excel, PowerPoint, HTML, OpenOffice (ODT) и другие. При этом исходная структура и форматирование документа сохраняются. Благодаря упомянутой выше поддержке ePub и FB2, пользователи могут создавать из PDF-документов любительские электронные книги для чтения на планшетах и других портативных устройствах. Отдельно стоит отметить возможность создания PDF из файлов изображений (JPEG, JPEG2000, JBIG2, PNG, BMP, GIF, TIFF) и поддержку потокового конвертирования документов.
Пригодится новый FineReader и тем, кто по долгу службы часто сталкивается с процессом согласования договоров или работает с документами, для которых характерна версионность. Возможности инструмента «Сравнение документов» позволяют сверять документы в различных форматах, быстро находить даже самые мелкие несоответствия в тексте и предотвращать тем самым подписание или публикацию некорректной версии документа. Автоматическое сравнение документов поможет существенно сэкономить время юристам, менеджерам по продажам, финансистам, логистам, а также всем офисным сотрудникам, которые сталкиваются со сравнением документов — договоров, актов, прайс-листов или других материалов.
Параллельный просмотр различий
Проводить сравнение документов можно как в текстовых, так и в графических (отсканированные документы или их фотографии, PDF без текстового слоя и т. п.) форматах. Для удобства работы с полученными результатами все обнаруженные несоответствия отображаются на отдельной панели, а также подсвечиваются по тексту в обоих документах. Предусмотрена возможность создания подробного отчёта о различиях и последующего его сохранения в виде таблицы в формате Word или PDF-документа с комментариями в местах изменений. Полученную таблицу можно использовать для вставки в отчёт о согласовании документов или для ведения переговоров с контрагентом. Несущественные различия перед формированием отчёта можно удалить.
Сохранение результатов сравнения
Для предприятий среднего и крупного бизнеса в составе FineReader 14 представлено приложение-планировщик ABBYY Hot Folder, с помощью которого можно автоматизировать однотипные или повторяющиеся задачи по обработке документов в сети организации. Возможности программы позволяют выполнять пакетное конвертирование файлов, преобразование документов по расписанию и обработку почтовых вложений. Для начала работы необходимо выбрать компьютер, который будет заниматься выполнением перечисленных операций, указать рабочую директорию на файловом сервере и настроить список задач.
Обработка документов по расписанию
Таковы основные отличительные особенности нового поколения FineReader, определённо заслуживающего внимания тех, кто часто занимается оцифровкой бумажных документов. Программа предназначена для запуска в среде Windows, совместима со всеми популярными моделями сканеров и многофункциональных устройств (МФУ) и поставляется разработчиком в трёх редакциях — Standard, Business и Enterprise. Они различаются набором включённых инструментов, формами поставки и условиями лицензирования.
Редакции и формы поставки ABBYY FineReader 14
И последний штрих. Как и в случае с предыдущими версиями FineReader, условия лицензионного договора допускают установку продукта на один стационарный и один мобильный компьютер при соблюдении двух требований: оба устройства должны принадлежать человеку, который приобрёл продукт, и одновременно может быть запущена только одна копия программы. Таким образом, приложение можно установить и на рабочий ноутбук, и на домашний ПК, не нарушая тем самым условий лицензионного соглашения с компанией ABBYY.
Задача , описаная автором, может быть расширена до сравнения одного и того же документа, полученного например сканированием в планшетном сканере и изображения, полученного при помощи камеры,при съёмки из папки судебного дела.
В российском суде часто участники судебного заседания останавливаются для того, чтобы сличить документ с его фотографией. Но ещё чаще судья просто отказывается это делать.
Или например вывешивая судебное дело на сайте, размещаешь постраничные фотографии дела, при этом часто параллельно даёшь ссылку на скан того-же документа полученного на сканере ( или полученного тобой же из файла Word).
Было бы очень полезно, если бы была разработана и продавалась утилита (лучше программа) или в сети действовал on-line сервис, который бы подтверждал, своей электронной подписью степень идентичности фотографии и качественного скана.
Задача , описаненая автором, при этом несколько расширится, но польза вырастит неимоверно.
Можете к этому приделать GUI и коммерциализировать; а мне хватит скрипта на десять строк.
Если в документ будет добавлена, или удалена как у автора теста, строка, то различными будут признаны остаток текущей страницы и все последующие
Примерно так и делал на чертежах проектной документации.
Есть реальная задача сравнивать подписанный скан с изначальным оригиналом. При этом сам скан может быть весьма разного качества (не говоря уже об поворотах, сгибах и прочем, если он получен с помощью камеры смартфона)..
Задача сравнения 2-ух PDF в общем своём понимании не решаема в связи с форматом самих PDF файлов, Даже больше, нет уверенности в возможности правильного сравнения и, например, прошедших через FineReader распознование. И, даже больше, «нет» готовых инструментов для сравнения даже файлов в текстовом варианте по причинам и описанным в статье, как простая перенумерация строк рушит весь алгоритм сравнения, хотя как казалось бы какая «мелочь», но разработчики таких программ не мыслят «мелочами» и удобством пользователей создавая свои программы.
P.S. Для сравнения текстовых файлов пользуюсь программой Winmerge, и она, в целом соответствующая своему предназначению, тоже далека от совершенства от потребностей пользователей. Для сравнения текстовых файлов есть, среди разных программ, и программа Windiff…
А, у кого и какие предпочтения и почему при использовании каких программ сравнения текстовых файлов?
Допустим, вы создали проект договора в Word и отправили контрагенту. Он внёс правки и вернул документ. Чтобы понять, что именно изменилось в тексте, придётся сравнить старую версию договора с новой и потратить на это 20-30 минут. Но можно в разы быстрее.
Допустим, вы создали проект договора в Word и отправили контрагенту. Он внёс правки и вернул документ. Чтобы понять, что именно изменилось в тексте, придётся сравнить старую версию договора с новой и потратить на это 20-30 минут. Можно сделать быстрее – по кнопке в Word, но лучше воспользоваться специализированными решениями. Подробнее о них читайте в новом обзоре.
Онлайн-сервисы для сравнения: бесплатно и без SMS
С одной стороны, такие решения выглядят очень привлекательно. Платить за них не нужно, как только появилась необходимость – открываешь браузер, заливаешь два документа и видишь отличия в версиях договора. С другой стороны, есть и «подводные камни» – далеко не все бесплатные веб-сервисы гарантируют сохранность и конфиденциальность обрабатываемых данных. Вы точно готовы к тому, что ваш договор может появиться в открытом доступе?
Embedika Compire
С помощью этого онлайн-сервиса можно найти отличия в документах DOC/DOCX и PDF, сохранённых в как в одном формате, так и в разных. Чтобы сравнить версии, необходимо загрузить их на сайт:
Интерфейс удобный и на русском языке, чего не скажешь о большинстве аналогичных сервисов.
Dreaftable Online
Популярный зарубежный онлайн-сервис для сравнения документов. Видит различия в файлах DOC/DOCX и PDF. Чтобы выявить различия, нужно загрузить два файла на сайт.
У сервиса есть десктопная версия для Windows и открытые API.
Diff Checker
Ещё один популярный бесплатный онлайн-сервис – Diff Checker. Если нужно сравнить две версии документов в Word, достаточно перенести текст из них в соответствующие поля. Далее нужно нажать на кнопку «Find Difference»:
В сервисе также можно сравнить PDF-документы. Сверки файлов в разных форматах (Word/PDF) нет.
PDF Tools
Бесплатный онлайн-сервис для сравнения документов в одном или разных текстовых форматах. Принцип работы такой же, как у аналогов выше – загружаются две версии Word-Word, PDF-PDF и Word-PDF. Однако отличия отображаются не в двух полях, а в одном:
Интерфейс на русском языке. Удобный, но менее современный, по сравнению с другими сервисами (по мнению ECM-Journal). Есть десктопное решение.
Всё по закону. Сравнение документов от разработчиков корпоративного ПО
Если вы не готовы рисковать и использовать онлайн-сервисы, воспользуйтесь готовыми корпоративными решениями. Сравнивать документы в этом случае безопасно – ваш договор могут видеть только пользователи системы, у которых есть права доступа. Многие решения позволяют отслеживать, кто и когда вносил правки, а также формировать автоматический отчёт по последним изменениям.
ABBYY ScanDifFinder SDK
Решение от известного разработчика интеллектуальных решений. Встраивается в популярные информационные системы.
Основное преимущество ABBYY ScanDifFinder SDK – можно сравнивать документы как в разных текстовых форматах, так и в графических (сканы, фотографии документов, PDF без текстового слоя и т.д.).
Решение игнорирует незначительные изменения в тексте. Так, если изменилось форматирование или размер шрифта, вам не сообщат об этом. В специальном поле справа будут показываются только правки, которые влияют на смысл и содержание договора.
Результаты проверки можно выгрузить отдельным файлом с комментариями в форматах PDF или Word. Есть функция, которая позволяет создать отчёт о сравнении документов.
Сравнение документов в Directum
Решение автоматически сопоставляет две версии документа – Word-Word, Word-PDF, PDF-PDF. Также может сравнивать исходную версию договора со скан-копией, в которой нет текстового слоя. Это возможно благодаря интеллектуальным сервисам Directum Ario.
Для сравнения необязательно заносить изменённый документ в систему. Можно сверить договор, который находится в Directum, с сохранённой локально версией – например, находящейся на рабочем столе.
По итогам сверки в системе формируется отчёт с визуализацией отличий. Текст выделяется разным цветом в зависимости от типа правки (добавление, изменение, удаление). Более подробную информацию можно посмотреть в примечаниях к изменениям.
Решение предоставляется дополнительно при покупке Directum RX.
ТЕЗИС: сравнение и распознавание
Решение от разработчика системы электронного документооборота. Пользователи могут сравнивать электронные версии документов, а также сверять их со скан-копиями. Решение реализовано с использованием технологии ABBYY FineReader Engine.
За опцию придётся доплатить – 40% от стоимости основной лицензии.
Сравнение документов в 1С
Сервис ИТС «1C-ABBYY Comparator» разработан с использованием уже описанного решения от ABBYY. Функциональность та же: автоматически сравниваются как документы в привычном электронном формате – Word, PDF, так и в графическом – скан-копии и фотографии без текстового слоя.
Сервис оплачивается дополнительно, главное условие – нужно приобрести лицензию 1С.
Конечно, в этом обзоре собраны только популярные сервисы и решения для сравнения документов. Какое из них выбрать, решать вам.
Совет от ECM-Journal: если вы решили избавиться от мучительной ручной сверки документов, начните с малого – обратитесь к поставщику вашей системы. Возможно, у него уже есть готовое решение и он может вам помочь.
Сегодня мы сравним три программных продукта от компании ABBYY и разберемся какой продукт лучше подходит для ваших целей:
- ABBYY PDF Transformer+;
- ABBYY FineReader 15 Business;
- ABBYY FineReader 15 Enterprise.
ABBYY PDF Transformer+
Если Вам требуется программа для работы с PDF-файлами, а именно для их редактирования, создания, объединения и сканирования, то вам отлично подойдет ABBYY PDF Transformer+.
Из ограничений: нет возможности отредактировать отсканированный документ (только распознавание в текстовый формат и копирование результата), добавить или удалить внешние гиперссылки и водяные знаки, а также отредактировать PDF-формы.
Итог: идеально подходит, если вам необходимо внести текстовые правки в PDF-документ, а также конвертировать из PDF в другой формат (Word, Excel итд).
ABBYY FineReader 15 Business
Данная редакция включает в себя все функции PDF Transformer+, а так же позволяет редактировать отсканированные документы, удалять и редактировать водяные знаки, PDF-формы, гиперссылки, а также включает в себя программу ABBYY Hot Folder, позволяющая автоматически распознавать и конвертировать документы. (5 000 стр/мес
макс. 2 ядра процессора.)
Итог: ABBYY FineReader 15 Business идеально подходит, если вам необходимо сканировать и редактировать отсканированные документы, а так же иметь в наличии все инструменты для редактирования PDF-файлов.
ABBYY FineReader 15 Enterprise
Максимальная редакция, включающая весь функционал ABBYY FineReader Business, дополнительно к этому добавляется возможность сравнения документов в различных форматах.
Данная функция ABBYY FineReader 15 Enterprise идеально подойдет для тех, кто работает с договорами, Вам не придется вручную сравнивать ранее согласованный вариант договора с присланным оригиналом от партнера. Вы просто сканируйте присланный оригинал, и программа покажет отличия.
Дополнительно к этому увеличивается количество страниц, которые возможно распознать автоматически с помощью ABBYY Hot Folder (10 000 стр/мес макс. 4 ядра процессора.)
Что нового в ABBYY FineReader 15?
Возможности | FineReader 14 | FineReader 15 |
---|---|---|
Открытие и просмотр PDF-документов | ||
Просмотр PDF-документов | ✓ | ✓ улучшено (открытие до 40% быстрее) |
Разные режимы просмотра PDF (одностраничный или двухстраничный, полноэкранный или в пользовательском масштабе и т.д.) | ✓ | ✓ |
Навигация внутри PDF-документа с помощью пиктограмм и закладок | ✓ | ✓ |
Редактирование PDF-документов | ||
Редактирование текста PDF-документов | ✓(только в пределах строки) | ✓ улучшено в пределах абзаца |
Перемещение текстовых блоков и изображений на странице, изменение порядка текстовых блоков и изменение разметки страницы без конвертирования | - (только с конвертацией) | ✓ new |
Добавление строк и текстовых блоков (абзацев) в PDF-документ | ✓ (только в пределах одной строки) | ✓ улучшено |
Редактирование сканов в формате PDF на уровне абзаца | ✓ (только в пределах одной строки) | ✓ улучшено |
Поиск в тексте, комментариях, закладках и метаданных, выделение результатов поиска | ✓ | ✓ |
Добавление и редактирование комментариев с помощью инструментов разметки и рисования. Добавление статусов, печать PDF-документов со списками комментариев | ✓ | ✓ |
Добавление и редактирование закладок и гиперссылок | ✓ | ✓ |
Добавление и редактирование колонтитулов (в т.ч. нумерации страниц) | ✓ | ✓ |
Добавление нумерации Бейтса | ✓ | ✓ |
Просмотр, редактирование и удаление метаданных | ✓ | ✓ |
Заполнение PDF-форм, валидация введенной информации, импорт и экспорт данных из полей форм | ✓ | ✓ |
Защита PDF-документов | ||
Удаление конфиденциальной информации ("черный" маркер) | ✓ | ✓ |
Защита PDF-документа паролем от несанкционированного доступа, редактирования и/или печати | ✓ | ✓ |
Добавление и валидация цифровой подписи*, создание подписи из изображения | ✓ | ✓ |
Распознавание текста и конвертирование | ||
Создание документов PDF, PDF/A, PDF/UA из файлов изображений, MS Office, PDF и файлов других форматов | ✓ | ✓ |
Конвертация изображений и PDF-документов в различные редактирумые форматы, форматы изображений, электронных книг и др. | ✓ | ✓ |
Сохранение форматирования и структуры документа при конвертировании | ✓ | ✓ |
Проверка и редактирование результатов распознавания, форматирования и структуры документа | ✓ | ✓ улучшено |
Распознавание мультиязычных документов | 192 языка | 192 языка |
Определение и распознавание таблиц и диаграмм и графиков | ✓ | ✓ улучшено |
Редактор для предварительной обработки изображений (обрезка, яркость и контраст, утранение трапецивидных искажений, осветление фона и др. | ✓ | ✓ |
Извлечение текста, изображений, таблиц для дальнейшего использования | ✓ | ✓ |
ABBYY Hot Folder** | ||
Автоматизация задач по распознаванию и конвертации документов, в т.ч. по расписанию | ✓ | ✓ |
Сравнение документов** | ||
Сравнение документов на различных языках | 38 | 38 |
Сравнение документов в различных форматах, включая бумажные и электронные | ✓ | ✓ |
Обнаружение различий в тексте документа, заголовках, колонтитулах, нумерации | ✓ | ✓ |
Обнаружение битой кодировки в сравниваемых документах для избежания выявления ложных различий | ✓ | ✓ улучшено |
Сохранение результатов сравнения в формате PDF-документа с комментариями к найденным различиям или перечня различий в Microsoft Word | ✓ | ✓ |
Сохранение результатов сравнения в формате Word в режиме Исправлений (Track changes) | - | ✓ new |
Общее | ||
Год выпуска | 2017 | 2019 |
Редакции | Standard, Business, Enterprise | Standard, Business, Corporate |
Скидка на обновление с предыдущих версий (Upgrade) | При обновлении с ABBYY FineReader 11/12 или ABBYY PDF Transformer+ | При обновлении с ABBYY FineReader 12/14 |
Типы лицензий для организаций | Per Seat, Concurrent, Terminal | Per Seat, Concurrent, Remote User |
* Для использования функции необходимо иметь сертификат ключа электронной цифровой подписи.
** Доступно в редакции ABBYY FineReader 15 Corporate/ABBYY FineReader 14 Enterprise.
Читайте также: