Abbyy flexicapture как работает
В среднем, по данным экспертов ABBYY, такие системы позволяют сократить затраты на обработку документов более чем на 50%. При этом возврат инвестиций от их внедрения в среднем составляет от 3 месяцев до 1 года. Решения ABBYY позволяют увеличить скорость ввода данных до 10 раз, и сократить ошибки при вводе как минимум в 3 раза.
Анонс ID.Abonent с применением технологий ABBYY и VisionLabs
В ABBYY FlexiCapture появилась технология обработки естественного языка
11 января 2019 года ABBYY сообщила, что дополнила платформу ABBYY FlexiCapture технологиями обработки естественного языка (Natural language proccessing, NLP). Теперь решение может извлекать данные из неструктурированных документов, таких как договоры, уставы, доверенности, письма или тексты новостей. Кроме того, в решении появилась функциональность для оценки и улучшения качества изображений, а также мобильный клиент. Эти возможности делают ABBYY FlexiCapture универсальной платформой для интеллектуальной обработки любой информации из различных источников, включая смартфоны.
Благодаря технологиям NLP, платформа умеет находить в текстах документов важные сущности, такие как имена, названия организаций и адреса, а также выявлять значимые факты и связи между ними. С дополнительными функциональными модулями NLP ABBYY FlexiCapture юристы смогут в разы быстрее анализировать многостраничные договоры, выявлять значимые условия сделки и создавать карточки документов в корпоративной системе.
ABBYY FlexiCapture эффективно извлекает информацию даже из изображений низкого качества – например, размытых снимков или деформированных документов. Платформа может обрабатывать изображения со сложным фоном, печатями, водяными знаками, голограммами или исправлениями ручкой. Решение обрезает скан или фотографию по границам документа, выравнивает фон, повышает резкость текста и удаляет ненужные элементы, такие как подписи и печати. Если система понимает, что качественно распознать данные не удастся, то отправляет пользователю уведомление о необходимости сделать еще одну фотографию или скан. Это помогает снизить нагрузку на сотрудников компании, заранее исключив изображения, не пригодные для обработки.
- Технологии NLP для обработки данных из неструктурированных документов;
- Автоматическое улучшение изображений для эффективной работы с документами любого качества;
- ABBYY FlexiCapture Mobile Client – приложение на iOS или Android для быстрой и удобной передачи данных из документов, сфотографированных на мобильные устройства;
- Готовые коннекторы к RPA-системам ведущих производителей. ABBYY FlexiCapture расширяет функциональность сторонних решений с помощью технологий интеллектуальной обработки информации.
2017: FlexiCapture теперь использует технологии машинного обучения
13 июля компания ABBYY объявила об обновлении системы ABBYY FlexiCapture. В обновлённом решении используются технологии машинного обучения и свёрточных нейронных сетей, которые позволяют крупным организациям гибко управлять всей информацией в едином потоке.
«Во время цифровой трансформации бизнеса компаниям необходимо быстро запускать новые сервисы и выходить на новые рынки. Огромное количество ценной и важной информации поступает в организации в виде разрозненных документов из множества источников. ABBYY FlexiCapture даёт возможность автоматически обрабатывать и применять эти данные для развития бизнеса, а в результате — мгновенно реагировать на рыночные изменения и повышать качество обслуживания клиентов», — рассказал Дмитрий Шушкин, генеральный директор ABBYY Россия.
Единое решение для всех типов документов
Обновленная FlexiCapture способна стать ключевым элементом корпоративной инфраструктуры в крупных организациях, которые управляют множеством бизнес-процессов и обрабатывают большой поток информации, утверждают разработчики. Платформа классифицирует и извлекает данные из входящих электронных писем и вложений, бумажных документов, электронных документов в офисных форматах, фотографий с камер и мобильных устройств. Решение легко масштабируется и подходит для обработки любого объёма документации.
Автообучение
На результатах работы верификаторов система сама учится извлекать данные из ряда документов, что позволяет быстро настраивать шаблоны для новых типов документов. По мнению разработчиков, это особенно важно при реализации масштабных проектов с необходимостью обрабатывать большое количество данных.
«Технологии машинного обучения дают возможность гибко настраивать и изменять шаблоны для обработки новых видов документов. Таким образом, ABBYY FlexiCapture позволяет добавлять новые данные в информационные системы без значительных финансовых и временных затрат на доработку. Это особенно важно для компаний при выходе на новые рынки, изменении бизнес-процессов или запуске новых продуктов», — подчеркнули в компании.
Интеллектуальная классификация
Решение автоматически сортирует документы по типам и пользовательским категориям исходя из внешнего вида документа, с помощью свёрточных нейронных сетей, статистического и семантического анализа текста.
Обработка комплектов
Платформа может обрабатывать комплекты документов со сложной иерархической структурой, сравнивать информацию внутри комплектов и проводить междокументные проверки.
Мультитенантность
Теперь несколько групп пользователей могут работать с платформой независимо друг от друга, не имея доступа к данным и настройкам других подразделений. Систему могут одновременно использовать разные отделы, департаменты или филиалы в рамках одной организации. Это позволяет применять ABBYY FlexiCapture как единую корпоративную платформу для множества бизнес-процессов, таких как управление взаимоотношениями с клиентами, производственная, закупочная и юридическая деятельность компании, отметили в ABBYY.
Мониторинг SLA
Появилась возможность контролировать производительность системы, задавая время обработки и уровень важности для различных пакетов документов.
ABBYY FlexiCapture 11
5 февраля 2015 года ABBYY представила FlexiCapture 11, версию системы потокового ввода, которая автоматически извлекает данные из бумажных документов и сохраняет их в информационную систему предприятия. Используя это решение, компании сокращают издержки благодаря увеличению скорости обработки документов и улучшают качество вводимых данных.
ABBYY FlexiCapture востребована в организациях различных отраслей: банковской, страховой, энергетической, нефтегазовой, телекоммуникационной и других, а также в государственном секторе.
С 11й версией стало быстрее и удобнее верифицировать документы, из которых нужно извлечь большое количество данных, – многостраничные накладные, счета-фактуры, документы валютного контроля и т.д. Такая возможность особенно важна для компаний финансового, промышленного секторов и ритейла. Чтобы оператору было удобно ориентироваться в документе, добавлены возможности логической группировки или сворачивания полей, что увеличивает скорость обработки данных.
ABBYY FlexiCapture позволяет лучше распознавать документы плохого качества, даже те, где значения некоторых полей плохо читаются из-за помарок или низкого качества печати. Это упростит документооборот в территориально-распределенных компаниях, которые работают с большим количеством контрагентов. Решение может только по одному найденному полю, например, названию компании или БИК, подставить все остальные значения из базы поставщиков. Повысить качество данных помогает стандартизация: вне зависимости от того, в каком формате указаны сумма и дата во входящем документе, ABBYY FlexiCapture внесет данные в целевую систему в заданном компанией формате. Все это помогает минимизировать ошибки при обработке документов.
Также в новой версии добавлены возможности интеллектуальной обработки документов на основе их содержания. Теперь ABBYY FlexiCapture позволяет гибко настраивать этапы и логику обработки документов на основе любых данных из документа: имени отправителя, региону, дате, теме письма и т.д. Например, если компания работает с большим количеством поставщиков, можно настроить автоматическую маршрутизацию документов по названию компании.
Тестирование ABBYY FlexiCapture на серверах Huawei
В конце 2015 года Huawei и ABBYY стали стратегическими партнерами. Среди первых результатов – настройка конфигурации системы потокового ввода данных и документов ABBYY FlexiCapture на серверах Huawei. С этим совместным решением корпоративные клиенты могут обрабатывать более 1,5 млн. страниц документов в сутки.
Тестовые испытания ABBYY FlexiCapture на серверах Huawei завершились в ноябре прошлого года. Благодаря специальной настройке конфигурации ABBYY FlexiCapture на серверах Huawei FusionCube E9000 и Huawei RH1288 v3 удалось достичь высокой производительности системы потокового ввода данных.
Такая производительность требуется крупным компаниям и государственным учреждениям для обработки большого объема документов в короткие сроки. Так банкам необходимо проводить валютный контроль в срок от 3 до 10 дней, и автоматическая обработка клиентских документов значительно ускоряет этот процесс. В энергораспределительных компаниях поток финансовых документов необходимо обработать в течение последних 10 дней месяца. Максимальная нагрузка на систему приходится на этот период и требует высокой производительности. В ФНС России объемы обработки документов во время налоговой отчетности составляют свыше 1 млн. страниц в день.
«Количество документов в крупных компаниях и государственных структурах достигает колоссальных объемов. Обработка этих документов отнимает много времени и человеческих ресурсов. В таком случае технологии интеллектуальной обработки информации – незаменимы. В связке с мощным серверным решением они позволяют в ограниченный срок вводить и обрабатывать сотни тысяч страниц, что дает важные конкурентные преимущества. При этом компаниям не нужно перестраивать ИТ-инфраструктуру, решение встраивается в уже существующую информационную систему», — отмечает Дмитрий Шушкин, заместитель генерального директора ABBYY Россия.
2014: ABBYY FlexiCapture 10
Среди особенностей ABBYY FlexiCapture 10 – повышенная отказоустойчивость, основанная на поддержке кластерной технологии Microsoft Cluster Server. Кластер или набор независимых компьютеров обеспечивает непрерывность рабочего процесса, доступность и сохранность важной информации даже при серьезных отказах оборудования и ПО. Как полагают в компании, реализация повышенной отказоустойчивости может быть востребована в государственных структурах, транспортных компаниях, банках, операторах мобильной связи и в других компаниях, в чьей деятельности критичной является непрерывность процесса обработки документов.
В проектах, связанных с потоковым вводом и извлечением данных, одним из ключевых является этап создания описаний документов. По ним система потокового ввода данных определяет, что это за документ и какую информацию из него предстоит извлечь. Реализованные в ABBYY FlexiCapture 10 технологии самообучения системы позволяют не только автоматизировать процесс создания описаний документов, но и дают возможность специалистам редактировать такие описания сразу после их создания — для улучшения результата работы системы в дальнейшем. Это, в свою очередь, сокращает и упрощает выполнение этапа настройки системы. Создание классификатора документов и его настройка в новой версии продукта также могут производиться автоматически, путем обучения системы на 3-5 примерах документов каждого типа.
В дополнение к ранее поддерживаемому режиму работы в локальной сети в ABBYY FlexiCapture 10 реализовано взаимодействие рабочих мест операторов с сервером системы через интернет. Веб-интерфейс станции верификации позволяет производить удаленную проверку данных. Таким образом, компании теперь могут нанимать персонал в других регионах или странах и снижать расходы за счет возможности использования удаленных рабочих мест.
Для станции сканирования в новой версии ABBYY FlexiCapture также поддерживается дистанционная установка через интернет. При этом настройки сканирования могут быть заданы оператором на месте или загружены с сервера. Данная технология позволяет создать централизованный электронный архив документов в компаниях с широкой территориальной сетью.
Оптимзированная масштабируемость не только обеспечивает простой переход системы с локального типа установки на сетевой, но и позволяет увеличивать количество обрабатываемых страниц, утверждают разработчики. Это делает ABBYY FlexiCapture 10 востребованной как для предприятий малого и среднего бизнеса, так и в крупных организациях и проектах.
ABBYY FlexiCapture 10 автоматически обрабатывает большие объемы разных типов документов в одном потоке. Программа выделяет из потока отдельные документы, извлекает из них необходимые данные и отправляет результаты вместе с изображением оригинального документа в базы данных, архивы и любые приложения. С решением ABBYY различные организации, в том числе страховые компании и банки, крупные корпорации, правительственные структуры и образовательные учреждения, могут автоматизировать процесс ввода документов и данных в информационные системы, снизить затраты и повысить качество обслуживания клиентов.
Появление в программе новых функций, позволяющих еще шире использовать возможности веб-станций, обусловлено потребностями рынка. Среди клиентов ABBYY множество крупных, территориально распределенных компаний, для которых подобная функциональность высоко востребована. Так, например, в удаленном офисе обслуживания клиентов не всегда есть возможность оперативно установить и настроить необходимое программное обеспечение на рабочем месте сотрудника. При этом веб-интерфейс позволяет в окне браузера открывать всегда обновленную версию программного обеспечения. Это актуально, в частности, для страховых компаний с обширной филиальной сетью.
Использование веб-приложений в ходе автоматизации обработки документов будет эффективно для ряда организаций:
- В компаниях, которые под конкретные проекты привлекают сотрудников, работающих на дому. Например, в исследовательских агентствах, набирающих студентов для проведения массовых исследований;
- В организациях, где используют бизнес-модель «партнерских продаж», с привлечением сотрудников сторонних организаций. Например, в банках с точками выдачи кредитов в торговых сетях;
- В компаниях, где стремятся сократить операционные издержки и выносят трудоемкие операции верификации документов в бэк-офис, в региональные отделения, тем самым оптимизируя затраты по ФОТ (фонд оплаты труда), а также по аренде и содержанию офисов.
2013: ABBYY FlexiCapture 9.0
ABBYY FlexiCapture 9.0 — это решение для потокового ввода данных и обработки документов. Автоматически извлекает информацию из бумажных документов и форм и сохраняет ее для различных информационных систем предприятия.
Продукт представляет собой единый центр ввода документов и способен обрабатывать любые типы документов вне зависимости от структуры:
- Формы с жесткой структурой/структурированные документы: анкеты, экзаменационные тесты, бланки, страховые формы, запросы на выплату медицинской страховки, налоговые декларации и т.п.
- Слабоструктурированные документы: счета, заказы на покупку, транспортные накладные и т.п.
- Неструктурированные документы: письма, контракты, статьи и т.п.
Структура и составляющие
Инструментарий для разработчика (SDK — software developer kit)
Инструментарий 9.0 отличается оптимизированной, по сравнению с предыдущей версией, работой в многопоточных серверных решениях, а также поддержкой как 32-, так и 64-разрядных архитектур. Создавать собственные приложения с применением ABBYY FlexiCapture Engine верси 9.0 стало намного быстрее и проще, утверждают в компании. Для удобства разработчиков в SDK полностью обновлены и расширены возможности API (application programming interface — интерфейс прикладного программирования).
Так, API — FlexiCaptureProcessor — теперь обеспечивает прямой доступ к технологиям FlexiCapture, что дает возможность разработчику через код (а не визуальную среду, как было в прошлой версии) управлять процессом обработки: загружать изображения, накладывать параметры обработки, формировать список накладываемых шаблонов и осуществлять выгрузку данных. При этом оптимизированное руководство разработчика позволяет быстро и легко находить необходимую информацию, а обширная библиотека исходных кодов поделена на разделы и содержит пошаговую инструкцию по работе с ними. Используя примеры кодов в создаваемом приложении, можно значительно ускорить разработку и сократить процесс обучения, подчеркнули в ABBYY.
Благодаря новому сценарию Mobile Data Capture (MDC) можно получить более качественные результаты распознавания изображений, сделанных камерой мобильного телефона — процесс обработки осуществляется на сервере. Технология MDC позволяет исправлять характерные для фотографий искажения, в том числе трапециевидные искажения, шумы и нечеткость.
В свою очередь, новый многоуровневый классификатор документов при работе с большим количеством шаблонов позволяет предварительно идентифицировать отдельные страницы и отнести их к определенному типу документа. Благодаря этому сокращается время поиска необходимых шаблонов документов.
Технология «черного маркера» защищает конфиденциальную информацию на изображениях и PDF-файлах. При использовании этой технологии на документе остаются видимыми только те поля, которые нужны, конфиденциальная же информация скрывается, закрашиваясь «черным маркером», пояснили в ABBYY.
Кроме того, ABBYY FlexiCapture Engine 9.0 позволяет создавать PDF-файлы с ультравысоким сжатием MRC (Mixed Raster Content). С помощью этой технологии размер файла может уменьшиться до 10 раз, по сравнению с JPEG-сжатием.
Универсальная платформа для интеллектуальной обработки информации.
Как это работает
ABBYY FlexiCapture – универсальная платформа для интеллектуальной обработки информации. Решение позволяет извлекать данные из любых типов входящих документов: например, из отсканированных бумаг, фотографий, электронных писем или вложений. Решение классифицирует, распознает документы, извлекает данные, верифицирует и передает их в корпоративные информационные системы. ABBYY FlexiCapture может выступать единой корпоративной платформой для множества бизнес-процессов, таких как управление взаимоотношениями с клиентами, производственная, закупочная и юридическая деятельность компании.
1. Импорт
ABBYY FlexiCapture обрабатывает в едином потоке электронные письма, вложения и бумажные документы, электронные документы в офисных форматах, фотографии с камер и мобильных устройств. Решение легко масштабируется и подходит для обработки любого объёма документации, в форматах TXT, EML, XLSX, VSD, HTML, DOCX, XLS, VSDX, DOC, PPTX, HTM, PPT, и RTF.
2. Интеллектуальная классификация
Классификация с применением технологий искусственного интеллекта позволяет автоматически сортировать документы по типам (например, когда необходимо оперативно отсортировать анкету клиента от всех других документов, которые подает клиент для открытия счета в банке) и по пользовательским категориям (например, накладные от поставщика А и накладные от поставщика Б).
Благодаря глубинному обучению свёрточных нейронных сетей, система сама учится находить нужные поля и определять типы документов. Для автоматического определения нового класса документов достаточно ввести в систему 10 образцов, принадлежащих к одному типу. Технология автоматически научится определять тип документа по внешнему виду или взаимному расположению элементов.
Пользователь системы может самостоятельно настроить скорость её работы, регулируя полноту распознавания и точность классификации.
- ABBYY FlexiCapture умеет собирать документы в комплекты по заданным алгоритмам. Система автоматически проверяет состав, количество, наличие и порядок расположения всех документов в комплекте, если такая проверка предусмотрена настройками.
- Решение также может собирать разрозненные многостраничные документы. Система сборки сохраняет порядок следования разделов, номера, число страниц в каждом разделе и правила сборки страниц в единый документ по настроенным правилам.
3. Распознавание
Высокая точность распознавания текстов, штрихкодов и меток.
Система распознает в документе только необходимый для дальнейшей работы текст.
- Распознавание печатного текста на 190 языках;
- Распознавание текста, написанного от руки печатными буквами, на 110 языках;
- Распознавание линейных и двухмерных штрихкодов;
- Распознавание различных меток и галок.
4. Извлечение данных
ABBYY FlexiCapture автоматически извлекает данные из любых видов документов. Система может обрабатывать данные из структурированных и неструктурированных документов.
Автоматические проверки данных:
- Сверка информации, введённой из документов, с базами данных;
- Проверка форматирования;
- Нормализация: приведение в единый вид по-разному написанных, но одинаковых по значению данных для их сравнения с другими источниками и корректного наполнения информационных систем;
- Подключение пользовательских алгоритмов проверки.
5. Верификация
Система позволяет быстро сравнить данные распознавания с отсканированным оригиналом документа и автоматически подсвечивает неуверенно распознанные данные, а также отображает информацию о не пройденных проверках данных по справочникам и настроенным правилам. Возможны следующие способы проверки данных:
6. Экспорт данных
ABBYY FlexiCapture автоматически сохраняет результаты распознавания в файлы различных форматов, экспортирует их в базы данных, учётные системы и другие информационные системы, исходя из требований бизнеса. Данные можно одновременно экспортировать в различные директории и преобразовать сразу в несколько форматов.
- ABBYY FlexiCapture позволяет настроить экспорт данных в корпоративные хранилища документов Microsoft™ SharePont. В результате можно получить библиотеку изображений документов, а дополнительные колонки для каждого документа будут заполнены значениями определенных полей.
- ABBYY FlexiCapture может экспортировать документы в базы данных, соответствующие стандарту ODBC – например, Oracle, Microsoft SQL Server, и Microsoft Access.
- ABBYY FlexiCapture может передавать данные в системы планирования ресурсов предприятия (ERP), управления контентом (ECM) и взаимоотношениями с клиентами(CRM) .
7. Консоль администрирования и мониторинга
ABBYY FlexiCapture включает в себя консоль на базе HTML5, с помощью которой можно выполнять администрирование комплекса и осуществлять мониторинг работы.
С помощью мониторинга работы комплекса в новом удобном и интуитивно понятно интерфейсе можно оперативно получать информацию о работе комплекса.
Система позволяет настроить различные варианты отчетов:
Также возможно создание графиков и дашбордов для пользователей с разными ролями: администратор, пользователь и т.д.
Эти инструменты помогают анализировать поток обработанных документов, обеспечить непрерывность бизнес-процессов, оптимизировать и определить приоритеты в распределении ресурсов или пакетов для настройки производительности и устранения слабых мест.
ABBYY FlexiCapture - решение для потокового ввода данных и документов, которое автоматически извлекает информацию из бумажных документов и сохраняет ее в информационную систему предприятия.
ABBYY FlexiCapture позволяет различным организациям, в том числе крупным корпорациям, правительственным структурам и образовательным учреждениям, автоматизировать процесс ввода данных в информационные системы, снизить затраты и повысить качество обслуживания клиентов.
ABBYY FlexiCapture представляет собой единый центр потокового ввода данных и позволяет обрабатывать любые типы документов вне зависимости от структуры:
Документы с жесткой структурой или структурированные документы: анкеты, экзаменационные тесты, бланки, страховые формы, запросы на выплату медицинской страховки, налоговые декларации и т.п. Слабоструктурированные документы: счета, заказы на покупку, транспортные накладные и т.п. Неструктурированные документы: письма, контракты, статьи т.п.Процесс работы с ABBYY FlexiCapture состоит из нескольких этапов: на первом этапе происходят установка системы и настройка гибких описаний для обработки документов. После того как создан проект со всеми настройками и шаблонами, все типы документов могут обрабатываться в одном потоке. Стандартные этапы обработки документов включают импорт изображений из различных источников, распознавание, верификацию и экспорт полученных данных в различные информационные системы.
Процедура ввода и обработки данных в ABBYY FlexiCapture состоит из двух этапов – подготовительной стадии и стадии обработки. За отдельные стадии обычно отвечают разные пользователи – администратор и операторы.
Режим администратора предназначен для настройки всего процесса потокового ввода данных, подготовки гибких описаний документов и предварительного тестирования. Этот режим используется на подготовительной стадии и обеспечивает полный доступ ко всем возможностям системы, включая настройки обработки и инструменты для создания гибких описаний. Режим оператора предназначен только для операций по вводу и обработке данных, в частности для импорта/сканирования документов, распознавания, верификации результатов распознавания и экспорта полученных данных. В этом режиме пользователь «общается» с программой посредством простого и интуитивно понятного интерфейса, который делает ежедневную работу с программой максимально удобной и неутомительной.На этапе настройки задаются правила обработки и осуществляется подготовка гибких описаний документов. Как правило, вышеперечисленные задачи выполняются администратором, который создает гибкие описания для всех типов документов, которые будут обрабатываться в рамках конкретного проекта.
В ABBYY FlexiCapture имеется набор инструментов для разработки и настройки гибких описаний различных документов:
ABBYY FormDesigner (дизайнер форм) – модуль для создания и тиражирования бланков так называемой «жесткой» формы, которые предназначены для заполнения от руки. ABBYY FormDesigner позволяет создавать широкий спектр бланков: черно-белые и цветные, линейчатые и растровые, одно- и многостраничные.
Новая версия ABBYY FormDesigner позволяет обрабатывать не только бумажные формы, но и электронные. С помощью специального приложения ABBYY FormDesigner возможно самостоятельно создавать формы в формате PDF, которые могут быть использованы, например, для заполнения форм в Интернете.
ABBYY FlexiLayout Studio – мощный инструмент по созданию гибких описаний для документов с нежесткой структурой, то есть тех документов, на которых расположение однотипных данных может варьироваться от одного экземпляра к другому. Для гибких описаний в интерфейсе программы принято название FlexiLayout. Гибкое описание FlexiLayout позволяет системе извлекать из документов с нежесткой структурой необходимые данные, как то: текстовые строки, штрихкоды, даты, валютные символы, числа, разделители, таблицы.
Например, используя лишь одно гибкое описание программа может найти все необходимые поля на счетах, поступающих от разных поставщиков и имеющих разный формат, даже если это многостраничные документы. ABBYY FlexiLayout Studio предлагает эффективные и удобные средства для тестирования и настройки гибких описаний на наборе изображений документов: дерево гипотез, эталонные описания, язык FlexiLayout.
Реализованные в ABBYY FlexiCapture технологии самообучения системы позволяют не только автоматизировать процесс создания описаний документов, но и дают возможность специалистам редактировать такие описания сразу после их создания для улучшения результата работы системы в дальнейшем. Это существенно сокращает сложность выполнения данного этапа работы и его длительность.
Document Definition Editor (редактор определения документов) – специальный модуль для создания определений документов любого типа. С его помощью Администратор может настроить правила обработки, указывающие программе, как идентифицировать отдельный тип документов в общем потоке данных и какие операции необходимо совершить с этим этими документами в процессе обработки. Администратор также может указать, какие данные необходимо извлечь и как их следует распознавать, проверять, верифицировать и экспортировать.
Обработка документов
Импорт документов: сканирование, e-mail, обычная и «горячая» папка
Бумажные документы могут быть импортированы в программу при помощи сканирующего устройства (сканера или МФУ), поддерживающего протокол сканирования TWAIN или ISIS. Изображения документов также могут быть добавлены вручную из обычной папки, где они хранятся, либо автоматически из «горячей» папки.
Поддерживаемые графические форматы: PDF, BMP, PCX, PNG, JPEG, JPEG 2000, DjVu и TIFF, DCX. Операция импорта может быть упрощена и автоматизирована при помощи набора профилей импорта с заранее заданными настройками.
Кроме централизованного сканирования ABBYY FlexiCapture предлагает удаленный импорт документов, который идеально подходит для нужд крупных компаний с распределенной структурой или распределенными бизнес-процессами, предполагающими сканирование документов в точках входа и последующую их централизованную обработку. Оператор инсталлирует и запускает клиента сканирования простым щелчком по ссылке на веб-странице. Установка полностью автоматизирована и не требует на компьютере административных привилегий. Профили импорта могут настраиваться локально оператором сканирования или назначаться централизованно с сервера.
Распознавание документов
В ABBYY FlexiCapture встроена технология распознавания печатных символов (OCR) почти для 190 языков и технологию интеллектуального распознавания рукопечатных символов (ICR) для более чем 110 языков, а также технологии распознавания штрихкодов (1D и 2D), распознавания меток и полнотекстового распознавания неструктурированных документов с последующим экспортом в формат PDF с возможностью полнотекстового поиска.
Стадия распознавания включает в себя предварительную обработку изображения, классификацию документов и извлечение из них данных и текста с последующим автоматическим контролем данных. Все эти операции выполняются автоматически и могут осуществляться в фоновом режиме.
Предварительная обработка изображенийИмпортированные изображения документов могут быть подвергнуты предварительной обработке для обеспечения максимального качества распознавания. Предварительная обработка подразумевает ряд операций по корректировке ориентации страниц, инвертированию, удалению перекосов и шума.
Автоматическая классификация документовABBYY FlexiCapture накладывает существующие гибкие описания на импортированные изображения и собирает отдельные неупорядоченные страницы в документы. Для идентификации различных типов документов в обрабатываемом потоке используется технология интеллектуального распознавания документов (IDR, Intelligent Document Recognition) и технология FlexiCapture. ABBYY FlexiCapture автоматически классифицирует документы с нежестко заданной структурой любой сложности, включая многостраничные документы с разным количеством страниц, многостраничные таблицы и документы, имеющие при себе приложения в виде картинок и текстов.
После наложения шаблонов и обнаружения необходимых полей из них извлекаются данные при помощи высокоточных технологий многоязычного распознавания. Неструктурированные документы распознаются при помощи технологии полнотекстового распознавания для получения PDF-файлов с возможностью полнотекстового поиска.
В процессе распознавания программа автоматически применяет правила контроля данных, заданные администратором на этапе разработки гибких описаний. Наиболее распространенные типы правил включают в себя проверку формата чисел и дат, проверку по базе данных, проверку сумм, замену значений из списка, нормализацию дат и цен. Для многих типов данных имеются словари разрешенных слов, которые также могут использоваться в процессе контроля данных.
Верификация данных
Когда распознавание закончено, каждому символу присваивается статус, отражающий надежность распознавания: символ может быть надежно распознанным, ненадежно распознанным или нераспознанным. Последние два статуса означают, что оператору необходимо подтвердить гипотезу системы или внести исправления. Этот этап требует больше ручного труда, чем остальные. Для ускорения и упрощения процесса верификации в ABBYY FlexiCapture встроен специальный верификационный интерфейс, которые предлагает три режима работы: групповая верификация (больше всего подходит для проверки меток и цифр), верификация полей (для проверки текстовых полей) и верификация в окне «Документ» (для корректировки правил).
В процессе верификации также осуществляется корректировка правил сборки с использованием уменьшенных изображений документов, корректировка правил контроля данных и ручное индексирование при помощи «ввода на основе изображения» (Key From Image, KFI).
Проверку неуверенно распознанных символов можно производить прямо в окне браузера. Веб-станция верификации данных не требует установки на компьютер пользователя и доступна везде, где есть Интернет.
Экспорт данных и архивирование документов
Извлеченные данные могут быть экспортированы во внешние базы данных (через ODBC) или в файлы, переданы в бизнес-приложения или системы электронного документооборота. Данные могут экспортироваться в чистом виде или вместе с приложенными изображениями и текстами. Документы могут сохраняться в архивы как файлы в формате PDF/PDF-A с возможностью полнотекстового поиска.
ABBYY FlexiCapture 10 поддерживает широкий спектр форматов сохранения данных (XML, XLS, DBF, CSV, TXT) и изображений (TIFF, JPEG, JPEG 2000, PDF, PDF/A, PCX, BMP, PNG).
This section describes how to use scripts for customizing processing stages and the stations interface in ABBYY FlexiCapture.
Supported scripting languages
Specifics of usage
For each script, access permissions for all its parameters are originally known. Access permissions determine the subset of methods that are available from scripts. When addressing the object methods, permissions for returned objects are always inherited from the source object (exceptions from this rule are described in comments to the corresponding methods).
Note: Script objects cannot be used after completion of the script because of indeterminate object behavior.
Note: For debugging scripts written in ABBYY FlexiCapture script editor, the MessageBox method can be used.
Custom functions
The script editor allows users to create their own functions and procedures and then to call them from the code of scripts.
Custom functions and procedures should be written to the global module, which can be accessed from the Script Editor. For this, from the drop-down list on the toolbar of the script editor, select an available global module: Rule Global Script Module, Export Global Script Module, Events or NonInteractiveProcessor.
All functions within one module must be written in the same language. The core code of a script can be written in a language different from that used in the corresponding global module.
To call a function from its global module, a corresponding prefix (Rules, Export, Events or NonInteractiveProcessor) must be used. For example, the function DoSomething from the Rule Global Script Module module must be called as follows: Rules.DoSomething ().
Script execution timeout
The default timeouts are 30 seconds for export and 10 seconds for other scripts.
To change the default timeouts, specify the following value in the registry:
The value of a timeout in the registry is specified in milliseconds. If a script takes longer to execute than the specified timeout, it will be terminated and an error message will be returned "Script execution timeout". If the script is a part of import, recognition or export task, a similar error message will be recorded in the log.
Important! Script execution timeout applies for scripts written in JScript and VBScript only.
Important! To change timeouts for scripts executed under the NetworkService, you need to modify the registry branch for the corresponding user profile.
Object model
The object model is compatible with scripts created in earlier versions of ABBYY FlexiCapture.
ABBYY FlexiCapture – универсальная платформа для интеллектуальной обработки информации. Решение позволяет извлекать данные из любых типов входящих документов: например, из отсканированных бумаг, фотографий, электронных писем или вложений. Решение классифицирует, распознает документы, извлекает данные, верифицирует и передает их в корпоративные информационные системы. ABBYY FlexiCapture может выступать единой корпоративной платформой для множества бизнес-процессов, таких как управление взаимоотношениями с клиентами, производственная, закупочная и юридическая деятельность компании.
Требования для работы подсистемы
Для работы необходимо следующее программное обеспечение:
- Платформа 1С 8.3х
- Конфигурация, написанная на библиотеке стандартных подсистем редакция 2.3 или выше. Тестировалось на БСП 2.3, 2.4. На более младших и более старших не тестировалось, но возможно будет работать и на них. Тестировалось на БП 3.0, Демо БСП, Транспортная логистика, экспедирование и управление автотранспортом, УТ 11. Номер релиза библиотеки стандартных подсистем, примененного в конкретной конфигурации можно посмотреть в регистре сведений "Версии подсистем", строка "Стандартные подсистемы" (Файл - Все функции - Регистры сведений - Версии подсистем)
- Abbyy FlexyCapture версия 9 или выше
- Adobe PDF reader
Описание подсистемы
Функционал подсистемы позволяет в автоматическом режиме получать распознанные данные от Flexicapture, определять тип метаданных, к которым необходимо привязать распознанный документ и выполнять прикрепление исходного сканированного документа. Реализовано получение документов только по FTP.
Настройки подсистемы универсальны. Список объектов, к которым есть возможность прикрепить файл ограничен только настройками самой библиотеки стандартных подсистем.
Схема работы
Текущий релиз позволяет получать сканированные документы посредством FTP протокола.
1. Сканированные документы загружаются на FTP сервер непосредственно со сканера или любым другим способом
2. Abbyy Flexicapture удаляет сканированный документ, производит распознание согласно настроенным макетам, разбирает многостраничный документ на отдельные PDF файлы, добавляет XML файл с описанием распознанных полей к каждому новому PDF файлу, загружает новые файлы на FTP
3. Регламентное задание 1С находит на FTP XML файлы, анализирует их, по имени схемы из XML находит нужную настройку метаданных, преобразовывает исходные значения согласно предварительно настроенным произвольным алгоритмам и ищет ссылочный объект в базе данных
4. В случае успешного поиска - ссылочный объект найден и он один - производится присоединение файла PDF с использованием подсистемы БСП "Присоединяемые файлы" к ссылочному объекту
5. В случае не успешного поиска - более одного соответствия или ни одного соответствия - файл PDF вместе с имеющимися распознанными данными сохраняется в бинарном формате в регистре сведений.
6. Оператор сканирования с помощью АРМ оператора сканирования производит разбор не привязанных документов. Возможна привязка путем заполнения некорректно распознанных реквизитов или выбором объекта из списка. Для просмотра pdf файлов необходим установленный Adobe reader
Встраивание подсистемы
Функционал подсистемы написан на управляемых формах, на базе библиотеки стандартных подсистем, благодаря чему интеграция подсистемы заключается только в переносе объектов подсистемы в конфигурацию. Дополнительного кода не требуется.
Причины купить
- Значительное уменьшение времени на обработку потока входящих документов, что особенно критично при больших и очень больших объемах документооборота
- Оперативный контроль поступления документов от партнеров.
- Электронный архив всех документов
- Помощь в интеграции решения в Вашу конфигурацию
Достоинства
- Универсальное решение для потокового ввода документов в любую типовую и нетиповую конфигурацию, написанную на библиотеке стандартных подсистем.
- Возможность централизованной привязки сканов из удаленных подразделений в центральную базу простым сканированием документов на МФУ с настроенным FTP
- Гибкая настройка под любые объекты (справочники, документы, бизнес-процессы)
Гарантия возврата денег
ООО "Инфостарт" гарантирует Вам 100% возврат оплаты, если программа не соответствует заявленному функционалу из описания. Деньги можно вернуть в полном объеме, если вы заявите об этом в течение 14-ти дней со дня поступления денег на наш счет.
Программа настолько проверена в работе, что мы с полной уверенностью можем дать такую гарантию. Мы хотим, чтобы все наши покупатели оставались довольны покупкой.
Читайте также: