- О программе ABBYY FlexiCapture
- Установка и запуск программы
- Архитектура комплекса ABBYY FlexiCapture
-
Настройка программы
- Настройка программы ABBYY FlexiCapture
- Работа в мультитенантной системе
-
Создание проекта
- Свойства проекта
- Переменные окружения
- Импорт изображений
- Типы пакета
- Настройка процесса обработки
- Инструменты
- Приоритет пакета по умолчанию
- Настройка SLA
- Управление правами пользователей
- Регистрационные параметры
- Загрузка проекта на сервер
- Тестовый проект
- Настройка внешнего вида программы
- Качество отображения изображений
-
Создание определения документа
- Создание определений структурированного документа
- Создание определений для неструктурированных и частично структурированных документов
- Создание определений документов без автоматического извлечения данных
- Комплекты документов
-
Поля определения документа
- Текстовые поля ввода
- Метки
- Группы меток
- Штрих-коды
- Картинки
- Таблицы
- Группы полей
- Служебные поля
- Индексные поля
- Ссылка на существующее поле
- Поля без разметки
- Создание поля с непрямоугольной областью
- Поля с несколькими областями
- Поля с несколькими экземплярами
- Изменение названия поля
- Копирование, перемещение, удаление полей
- Исключение региона из распознавания
- Мастер создания определения документа
- Редактирование и публикация определения документа
- Настройка сборки многостраничных документов
- Свойства определения документа
- Свойства раздела документа
- Проверка с помощью правил
- Настройка экспорта
- Настройка отображения данных в окне документа
- Тестирование определения документа
- Локализация определения документа
-
Классификация
- Сценарии классификации
- Профили классификации
- Типы ошибок и баланс точности\полноты
-
Настройка классификации во FlexiCapture
- Предварительная настройка
- Загрузка изображений и настройка классификатора
- Обучение классификатора
- Анализ результатов классификации
- Рекомендации по улучшению качества работы классификатора
- Экспорт и подключение классификатора
- Соответствие классов и определений документов
- Классификация документов по справочнику компаний
- Обучение поиску полей
- Работа оператора с настроенным проектом
-
Работа с ABBYY FlexiCapture for Invoices
- Возможности ABBYY FlexiCapture for Invoices
- Процесс ввода инвойсов
-
Настройка проекта для ввода инвойсов
- Настройка стран и языков
- Подключение справочников поставщиков и подразделений компаний
- Настройка экспорта данных
- Статус документа в проекте ABBYY FlexiCapture for Invoices
- Обучение в ABBYY FlexiCapture for Invoices
- Правила
- Извлечение дополнительных полей инвойсов
- Проверка позиций инвойса
- Дополнительные возможности работы операторов
- Использование более одного определения документа
- Редактирование настроек обработки инвойсов в XML
- Обновление определения документа для обработки инвойсов
- Налоговые схемы
- Спецификации
- Обработка чеков в ABBYY FlexiCapture for Invoices
- Обработка заказов в ABBYY FlexiCapture for Invoices
- Обработка документов при помощи NLP
- Интерфейс программы ABBYY FlexiCapture
-
Приложения
-
Использование скриптов в ABBYY FlexiCapture
- Особенности .Net скриптов
- Подключение внешней сборки
- Объектная модель
-
Использование скриптов для настройки этапов обработки
-
Типы скриптов
- Скрипт правила
- Скрипт автозамены
- Скрипт экспорта
- Пользовательский скрипт
- Скрипт сборки документа
- Скрипт пользовательского распознавания
- Скрипт маршрутизации
- Скрипты обработки
- Скрипт обновления набора данных
- Скрипт валидации набора данных
- Скрипт классификации документа
-
Обработчики событий
- Создание пакета
- Удаление пакета
- Изменение свойств пакета
- Изменение состава пакета
- Перемещение страниц
- Открытие/закрытие пакета
- Проверка целостности пакета
- Изменение свойства документа
- Изменение состояния документа
- Скрипт после экспорта
- Скрипт после проверки правил
- Перед наложением определений документов
- Запрос на верификацию поля
-
Объекты
- IActionResult
- IAssemblingError
- IAssemblingErrors
- IBatch
- IBatchCheckResults
- IBatchItem
- IBatchItems
- IBatchTypeClassifier
- IBatchTypeClassifierResult
- IBinarizationParams
- IBoxedBoolean
- ICharacterParams
- ICharactersParams
- ICheckmarkGroupValue
- ICheckmarkValue
- IDataSet
- IDataSetQuery
- IDataSetRecord
- IDocument
- IDocuments
- IDocumentExportResults
- IDocumentsExportResults
- IDocumentDefinitionInfo
- IDocumentDefinitionInfoArray
- IEditablePictureObject
- IExportFieldsToRedact
- IExportImageSavingOptions
- IField
- IFieldRegion
- IFieldRegions
- IFields
- IFlexiCaptureTools
- ILocalContrastParams
- IMatchedSectionInfo
- IMatchingInfo
- IPage
- IPageClassificationResult
- IPages
- IPictureObject
- IPictureObjectsInfo
- IPrincipal
- IPrincipals
- IProcessingCallback
- IProject
- IProperties
- IProperty
- IPropertyModificationInfo
- IRecordCheckResult
- IRecordset
- IRect
- IRects
- IRoutingRuleResult
- IRuleContext
- IRuleError
- IRuleErrors
- IRuleTag
- IRuleTags
- IScriptBinaryAttributes
- IScriptDefinitionContext
- ISectionDefinitionInfo
- ISectionDefinitionInfoArray
- IShadowsHighlightsParams
- IStageInfo
- IUserAttachment
- IUserAttachments
- IUserSessionInfo
- IValue
- IVARIANTArray
- TAssemlingErrorType
- TBatchItemType
- TColorToFilter
- TExportFieldType
- TExportType
- TImageCompressionType
- TPageClassificationType
- TPdfAVersion
- TPdfDocumentInfoType
- TPdfTextSearchAreaType
- TPrincipalType
- TProcessingPriority
- TPropertyType
- TRuleErrorType
- TStateType
- Примеры скриптов
- Внутренние имена языков распознавания
-
Типы скриптов
-
Использование скриптов для обработки событий интерфейса
-
События
- После закрытия документа
- После закрытия проекта
- При активации документа в окне задания
- При активации поля
- При возврате из задания
- При вызове пользовательской команды
- При деактивации поля
- При закрытии документа
- При закрытии задания
- При закрытии проекта
- При изменении региона
- При изменении режима окна задания
- При открытии документа
- При открытии окна задания
- При отмене задания
- При отображении региона
- При отправке задания на этап
- При подтверждении текстового поля
-
Объекты
- IBoolean
- IBoxedFieldControl
- IDocumentEditor
- IDocumentItem
- IDocumentItems
- IDocumentsCollection
- IDocumentsWindow
- IDrawContext
- IErrorControl
- IErrorControls
- IErrorsWindow
- IFieldControl
- IFieldRegionControl
- IFieldRegionControls
- IFormWindow
- IImageWindow
- IMainMenu
- IMainWindow
- IMenu
- IMenuItem
- IPageControl
- IPageItem
- IPageItems
- IPagesCollection
- IPoint
- ISelection
- IShellRational
- IShellRect
- IShellRects
- ITaskWindow
- ITextEditor
- IToolbar
- IToolbarButton
- IToolbars
- TCommandBarType
- TCommandID
- TDockingType
- TDocumentState
- TErrorType
- TSelectionType
- TTaskWindowMode
- TTextSize
- TUserRole
- TWorkWindowType
-
События
- Пользовательский скрипт (Web Custom Action) для Веб-станции Верификации
- Создание машиночитаемых форм
-
Горячие клавиши
- Горячие клавиши на Станции Настройки Проектов
- Горячие клавиши на Станции Верификации
- Горячие клавиши на станции верификации данных
- Горячие клавиши в окне Редактора определения документа
- Горячие клавиши в окне групповой верификации
- Горячие клавиши в окне контекстной верификации
- Настройка горячих клавиш
- Дополнительные настройки
- Описание команд Сервера Обработки
- Встроенные примеры проектов FlexiCapture
- Поддерживаемые языки распознавания
- Поддерживаемые языки классификатора
- Шрифты для корректного отображения символов
- Поддерживаемые типы текста
- Поддерживаемые типы штрих-кодов
- Поддерживамые входные форматы
- Особенности работы с файлами формата PDF
- Форматы файлов экспорта
- Формат отображения даты
- Алфавит, используемый в регулярных выражениях
- Патенты
- Технологии других компаний
- Глоссарий
- Техническая поддержка
- Как купить программу ABBYY FlexiCapture
- Лицензионный договор с конечным пользователем
-
Использование скриптов в ABBYY FlexiCapture
Обучение в ABBYY FlexiCapture for Invoices
ABBYY FlexiCapture for Invoices позволяет пользователю обучить программу предварительно или в процессе ввода инвойсов для повышения качества автоматической обработки инвойсов.
Обучение применяется исключительно на тех изображениях или в тех случаях, когда:
- у преднастроенного определения документа возникли проблемы с нахождением правильного положения полей инвойса на изображении;
- пользователь хочет извлекать из изображений новые поля, не предусмотренные по умолчанию определением документа ABBYY FlexiCapture for Invoices.
Когда может потребоваться обучение
В потоке документов одного типа могут появляться специфичные документы с нетипичным расположением полей. Если в этом случае ABBYY FlexiCapture for Invoices не находит поля инвойса на изображении достаточно хорошо, пользователь может указать программе правильное расположение полей, после чего ABBYY FlexiCapture for Invoices «обучится» и станет находить поля на данной разновидности инвойсов более точно.
Наряду с базовыми и дополнительными полями, извлечение которых поддержано в ABBYY FlexiCapture for Invoices по умолчанию, пользователю может потребоваться извлекать новые поля, не предусмотренные программой. В этом случае в определении документа ABBYY FlexiCapture for Invoices пользователь может создать новые поля, а затем указать их расположение на изображениях инвойсов, после чего программа начнёт распознавать их автоматически.
Как правило, инвойсы определённой разновидности свойственны конкретному поставщику. Поэтому ABBYY FlexiCapture for Invoices обучается независимо на инвойсах от разных поставщиков. Инвойсы от разных поставщиков считаются разными разновидностями документа.
Как работает обучение
Пользователь в процессе штатного ввода документов или в специальном режиме, предназначенном для обучения, добавляет изображения инвойсов. Они автоматически распознаются, после чего оператор их верифицирует. В процессе верификации пользователь исправляет разметку полей на изображении инвойса, указывая программе правильное расположение полей на изображении — создает эталонную разметку.
После этого пользователь может добавить данный документ в набор примеров для разновидности иновойсов, определяемой поставщиком. Администратор может видеть список всех разновидностей инвойсов и наборы примеров изображений документов для них в специальном виде Открыть пакеты обучения извлечения полей. После того, как для разновидности добавлен первый пример документа, разновидность переходит в состояние накопления примеров.
Для обучения разновидности требуется не менее трех документов. Когда в наборе накопится достаточное количество изображений документов, при добавлении нового документа или по явной команде пользователя ABBYY FlexiCapture for Invoices запустит обучение на данной разновидности инвойсов.
Результатом процесса обучения является гибкое описание для разновидности, которое будет применяться для всех документов данной разновидности, т.е. для всех инвойсов от данного поставщика.
После обучения гибкое описание для разновидности автоматически, без каких-либо действий со стороны пользователя, тестируется программой — все документы из набора примеров изображений для данной разновидности распознаются с использованием создавшегося гибкого описания.
Качество гибкого описания для разновидности определяется путем сравнения результата распознавания с эталонной разметкой, заданной пользователем. Аналогичным образом качество определяется для основного гибкого описания, которое используется ABBYY FlexiCapture for Invoices в отсутствии обучения. Затем качество гибкого описания для разновидности сравнивается с качеством предыдущей версии гибкого описания для разновидности, либо с качеством основного гибкого описания:
- если качество гибкого описания для разновидности проигрывает в сравнении, то такое гибкое описание не сохраняется, а пользователю выдаются соответствующие разъяснения в окне Обучить определение документа;
- если качество гибкого описания для разновидности оказывается выше, оно сохраняется и применяется при дальнейшей обработке документов данной разновидности, т.е инвойсов от данного поставщика.
Обучение в ABBYY FlexiCapture for Invoices происходит в процессе ввода документов. Пользователь добавляет в рабочий пакет изображения инвойсов, они автоматически распознаются, после чего оператор их верифицирует. В процессе верификации пользователь исправляет разметку полей на изображении инвойса, указывая программе правильное расположение полей на изображении. При этом документ добавляется в набор для обучения разновидности документов, к которой он относится. Разновидность документов определяется компанией-поставщиком, от которой пришли инвойсы. Когда в наборе накопится достаточное количество изображений документов, при добавлении нового документа ABBYY FlexiCapture for Invoices запустит обучение на данной разновидности инвойсов, т.е. для данного поставщика. При дальнейшем вводе инвойсов от этого же поставщика будет применяться результат пользовательского обучения. Обучение в процессе ввода может быть разрешено не только администратору, но и операторам.
Если обучение в процессе ввода документов оператором не даёт ожидаемого результата, у администратора есть возможность перейти в специальный вид — Открыть пакеты обучения извлечения полей и продолжить обучение там. Администратор может:
- управлять набором документов для разновидности: добавлять новые документы, исключать нетипичные для разновидности документы;
- создавать новые пакеты обучения;
- добавить в набор документов для разновидности примеры документов, которые не участвуют в обучении, но применяются для автоматического тестирования гибкого описания для разновидности, получившегося в результате обучения;
- выгрузить результат обучения — гибкое описание для разновидности в программу ABBYY FlexiLayout Studio, а также загрузить гибкое описание для разновидности, созданное в программе ABBYY FlexiLayout Studio.
Данные возможности помогают администратору достичь максимального эффекта от обучения, после чего администратор может, например, запретить дальнейшее обучение данной разновидности документов в процессе ввода.
См. подробнее:
14.01.2021 14:17:24