- О программе ABBYY FlexiCapture
- Установка и запуск программы
- Архитектура комплекса ABBYY FlexiCapture
-
Настройка программы
- Настройка программы ABBYY FlexiCapture
- Работа в мультитенантной системе
-
Создание проекта
- Свойства проекта
- Переменные окружения
- Импорт изображений
- Типы пакета
- Настройка процесса обработки
- Инструменты
- Приоритет пакета по умолчанию
- Настройка SLA
- Управление правами пользователей
- Регистрационные параметры
- Загрузка проекта на сервер
- Тестовый проект
- Настройка внешнего вида программы
- Качество отображения изображений
-
Создание определения документа
- Создание определений структурированного документа
- Создание определений для неструктурированных и частично структурированных документов
- Создание определений документов без автоматического извлечения данных
- Комплекты документов
-
Поля определения документа
- Текстовые поля ввода
- Метки
- Группы меток
- Штрих-коды
- Картинки
- Таблицы
- Группы полей
- Служебные поля
- Индексные поля
- Ссылка на существующее поле
- Поля без разметки
- Создание поля с непрямоугольной областью
- Поля с несколькими областями
- Поля с несколькими экземплярами
- Изменение названия поля
- Копирование, перемещение, удаление полей
- Исключение региона из распознавания
- Мастер создания определения документа
- Редактирование и публикация определения документа
- Настройка сборки многостраничных документов
- Свойства определения документа
- Свойства раздела документа
- Проверка с помощью правил
- Настройка экспорта
- Настройка отображения данных в окне документа
- Тестирование определения документа
- Локализация определения документа
-
Классификация
- Сценарии классификации
- Профили классификации
- Типы ошибок и баланс точности\полноты
-
Настройка классификации во FlexiCapture
- Предварительная настройка
- Загрузка изображений и настройка классификатора
- Обучение классификатора
- Анализ результатов классификации
- Рекомендации по улучшению качества работы классификатора
- Экспорт и подключение классификатора
- Соответствие классов и определений документов
- Классификация документов по справочнику компаний
- Обучение поиску полей
- Работа оператора с настроенным проектом
-
Работа с ABBYY FlexiCapture for Invoices
- Возможности ABBYY FlexiCapture for Invoices
- Процесс ввода инвойсов
-
Настройка проекта для ввода инвойсов
- Настройка стран и языков
- Подключение справочников поставщиков и подразделений компаний
- Настройка экспорта данных
- Статус документа в проекте ABBYY FlexiCapture for Invoices
- Обучение в ABBYY FlexiCapture for Invoices
- Правила
- Извлечение дополнительных полей инвойсов
- Проверка позиций инвойса
- Дополнительные возможности работы операторов
- Использование более одного определения документа
- Редактирование настроек обработки инвойсов в XML
- Обновление определения документа для обработки инвойсов
- Налоговые схемы
- Спецификации
- Обработка чеков в ABBYY FlexiCapture for Invoices
- Обработка заказов в ABBYY FlexiCapture for Invoices
- Обработка документов при помощи NLP
- Интерфейс программы ABBYY FlexiCapture
-
Приложения
-
Использование скриптов в ABBYY FlexiCapture
- Особенности .Net скриптов
- Подключение внешней сборки
- Объектная модель
-
Использование скриптов для настройки этапов обработки
-
Типы скриптов
- Скрипт правила
- Скрипт автозамены
- Скрипт экспорта
- Пользовательский скрипт
- Скрипт сборки документа
- Скрипт пользовательского распознавания
- Скрипт маршрутизации
- Скрипты обработки
- Скрипт обновления набора данных
- Скрипт валидации набора данных
- Скрипт классификации документа
-
Обработчики событий
- Создание пакета
- Удаление пакета
- Изменение свойств пакета
- Изменение состава пакета
- Перемещение страниц
- Открытие/закрытие пакета
- Проверка целостности пакета
- Изменение свойства документа
- Изменение состояния документа
- Скрипт после экспорта
- Скрипт после проверки правил
- Перед наложением определений документов
- Запрос на верификацию поля
-
Объекты
- IActionResult
- IAssemblingError
- IAssemblingErrors
- IBatch
- IBatchCheckResults
- IBatchItem
- IBatchItems
- IBatchTypeClassifier
- IBatchTypeClassifierResult
- IBinarizationParams
- IBoxedBoolean
- ICharacterParams
- ICharactersParams
- ICheckmarkGroupValue
- ICheckmarkValue
- IDataSet
- IDataSetQuery
- IDataSetRecord
- IDocument
- IDocuments
- IDocumentExportResults
- IDocumentsExportResults
- IDocumentDefinitionInfo
- IDocumentDefinitionInfoArray
- IEditablePictureObject
- IExportFieldsToRedact
- IExportImageSavingOptions
- IField
- IFieldRegion
- IFieldRegions
- IFields
- IFlexiCaptureTools
- ILocalContrastParams
- IMatchedSectionInfo
- IMatchingInfo
- IPage
- IPageClassificationResult
- IPages
- IPictureObject
- IPictureObjectsInfo
- IPrincipal
- IPrincipals
- IProcessingCallback
- IProject
- IProperties
- IProperty
- IPropertyModificationInfo
- IRecordCheckResult
- IRecordset
- IRect
- IRects
- IRoutingRuleResult
- IRuleContext
- IRuleError
- IRuleErrors
- IRuleTag
- IRuleTags
- IScriptBinaryAttributes
- IScriptDefinitionContext
- ISectionDefinitionInfo
- ISectionDefinitionInfoArray
- IShadowsHighlightsParams
- IStageInfo
- IUserAttachment
- IUserAttachments
- IUserSessionInfo
- IValue
- IVARIANTArray
- TAssemlingErrorType
- TBatchItemType
- TColorToFilter
- TExportFieldType
- TExportType
- TImageCompressionType
- TPageClassificationType
- TPdfAVersion
- TPdfDocumentInfoType
- TPdfTextSearchAreaType
- TPrincipalType
- TProcessingPriority
- TPropertyType
- TRuleErrorType
- TStateType
- Примеры скриптов
- Внутренние имена языков распознавания
-
Типы скриптов
-
Использование скриптов для обработки событий интерфейса
-
События
- После закрытия документа
- После закрытия проекта
- При активации документа в окне задания
- При активации поля
- При возврате из задания
- При вызове пользовательской команды
- При деактивации поля
- При закрытии документа
- При закрытии задания
- При закрытии проекта
- При изменении региона
- При изменении режима окна задания
- При открытии документа
- При открытии окна задания
- При отмене задания
- При отображении региона
- При отправке задания на этап
- При подтверждении текстового поля
-
Объекты
- IBoolean
- IBoxedFieldControl
- IDocumentEditor
- IDocumentItem
- IDocumentItems
- IDocumentsCollection
- IDocumentsWindow
- IDrawContext
- IErrorControl
- IErrorControls
- IErrorsWindow
- IFieldControl
- IFieldRegionControl
- IFieldRegionControls
- IFormWindow
- IImageWindow
- IMainMenu
- IMainWindow
- IMenu
- IMenuItem
- IPageControl
- IPageItem
- IPageItems
- IPagesCollection
- IPoint
- ISelection
- IShellRational
- IShellRect
- IShellRects
- ITaskWindow
- ITextEditor
- IToolbar
- IToolbarButton
- IToolbars
- TCommandBarType
- TCommandID
- TDockingType
- TDocumentState
- TErrorType
- TSelectionType
- TTaskWindowMode
- TTextSize
- TUserRole
- TWorkWindowType
-
События
- Пользовательский скрипт (Web Custom Action) для Веб-станции Верификации
- Создание машиночитаемых форм
-
Горячие клавиши
- Горячие клавиши на Станции Настройки Проектов
- Горячие клавиши на Станции Верификации
- Горячие клавиши на станции верификации данных
- Горячие клавиши в окне Редактора определения документа
- Горячие клавиши в окне групповой верификации
- Горячие клавиши в окне контекстной верификации
- Настройка горячих клавиш
- Дополнительные настройки
- Описание команд Сервера Обработки
- Встроенные примеры проектов FlexiCapture
- Поддерживаемые языки распознавания
- Поддерживаемые языки классификатора
- Шрифты для корректного отображения символов
- Поддерживаемые типы текста
- Поддерживаемые типы штрих-кодов
- Поддерживамые входные форматы
- Особенности работы с файлами формата PDF
- Форматы файлов экспорта
- Формат отображения даты
- Алфавит, используемый в регулярных выражениях
- Патенты
- Технологии других компаний
- Глоссарий
- Техническая поддержка
- Как купить программу ABBYY FlexiCapture
- Лицензионный договор с конечным пользователем
-
Использование скриптов в ABBYY FlexiCapture
Автообучение поиску полей
Автообучение помогает улучшить качество поиска полей во время обработки документов, используя результат работы операторов верификации.
Если поля документа не найдены или найдены неправильно, оператор указывает их правильное расположение. После того, как распознанные и отредактированные документы экспортированы, внесённые оператором изменения используются системой для автообучения.
Для работы автообучения нужно предварительно настроить систему.
Настройка автообучения
Для предварительной настройки автообучения в системе выполните следующие действия:
- Создайте определение документа.
- В свойствах раздела определения документа отметьте опцию Разрешать обучение поиска полей.
- Создайте в разделе необходимые поля. При создании отметьте опцию Может иметь регион в свойствах поля.
- Сохраните и опубликуйте определение документа.
- В свойствах типа пакета на вкладке Процесс обработки активируйте этап Обучение.
Существует возможность настроить автообучение для работы с документами, внешний вид которых значительно отличается внутри одного типа.
Для этого нужно создать разновидности, соответствующие конкретному расположению полей на документе, после чего обучить классификатор различению разновидностей.
Подробнее о разновидностях см. Вариативное расположение полей на документах одного типа.
Дополнительные шаги настройки разновидностей
Чтобы настроить использование разновидностей при автообучении, выполните следующие действия:
- Добавьте разновидности раздела документа одним из следующих способов:
- Создайте разновидности вручную. Для этого в свойствах раздела документа на вкладке Наборы данных нажмите кнопку Просмотр.... Затем добавьте разновидности с помощью кнопки Добавить....
- Загрузите разновидности из базы данных. В свойствах раздела документа на вкладке Наборы данных нажмите кнопку Настроить.... В качестве источника данных выберите в выпадающем списке База данных.
- Создайте разновидности с помощью скрипта. Для этого в свойствах раздела документа на вкладке Наборы данных нажмите кнопку Настроить.... В качестве источника данных выберите в выпадающем списке Скрипт.
- Сохраните и опубликуйте определение документа.
- Обучите классификатор для созданных разновидностей:
- Откройте режим Открыть пакеты обучения классификатора и загрузите изображения в новый пакет.
- Присвойте эталонные классы документам, используя разновидность как отдельный класс:
- Выберите опцию Назначить эталонный класс... → Добавить... → Добавить...
- Отметьте опцию Указывать разновидность.
- Выберите разновидность из списка.
- Обучите классификатор (Проект → Обучение классификатора → Обучить).
В процессе работы с результатами обучения может возникнуть необходимость проверить, какая разновидность была присвоена документу и отредактировать её. Для отображения идентификатора разновидности на форме создайте служебное поле. Подробнее см. Настройка редактирования разновидности оператором
Замечание. Если необходимо обучить систему поиску полей до начала работы с проектом, рекомендуется использовать обучение поиску полей администратором.
После того как администратор настроил определение документа, автообучение на станции верификации будет производиться автоматически.
Механизм работы автообучения
Документы с проверенной и откорректированной оператором разметкой полей копируются в пакет обучения.
На документы накладывается текущая версия обученного гибкого описания. Если все поля наложились правильно, то гибкое описание не требуется переучивать.
Замечание. Примером, когда обученное гибкое описание находит поля правильно, но оператору потребовалось их изменить, может быть следующий случай. Обработка документов производилась со старой версией гибкого описания или без результатов обучения. Пока данные документы находились в очереди на проверку, система обучила гибкое описание на других документах. В результате данные документы теперь обрабатываются правильно.
В этом случае документы остаются в пакете обучения в статусе Для тестирования и будут использоваться для регрессионного тестирования, то есть защиты от ухудшения будущих версий гибкого описания.
Если при наложении обученного гибкого описания на документы некоторые регионы полей не совпали, документы будут использованы для обучения новой версии гибкого описания. Им присваивается статус Для обучения.
Результатом обучения является новая версия гибкого описания. Оно сравнивается по качеству с предыдущей версией: обе версии гибкого описания накладываются на документы пакета обучения в статусах Для обучения и Для тестирования. Оценивается степень соответствия расположения регионов полей проверенной пользователем разметке. Гибкое описание, наиболее близкое к этой разметке, применяется в дальнейшем для обработки документов. Второе гибкое описание автоматически удаляется.
14.01.2021 14:17:24