- О программе ABBYY FlexiCapture
- Установка и запуск программы
- Архитектура комплекса ABBYY FlexiCapture
-
Настройка программы
- Настройка программы ABBYY FlexiCapture
- Работа в мультитенантной системе
-
Создание проекта
- Свойства проекта
- Переменные окружения
- Импорт изображений
- Типы пакета
- Настройка процесса обработки
- Инструменты
- Приоритет пакета по умолчанию
- Настройка SLA
- Управление правами пользователей
- Регистрационные параметры
- Загрузка проекта на сервер
- Тестовый проект
- Настройка внешнего вида программы
- Качество отображения изображений
-
Создание определения документа
- Создание определений структурированного документа
- Создание определений для неструктурированных и частично структурированных документов
- Создание определений документов без автоматического извлечения данных
- Комплекты документов
-
Поля определения документа
- Текстовые поля ввода
- Метки
- Группы меток
- Штрих-коды
- Картинки
- Таблицы
- Группы полей
- Служебные поля
- Индексные поля
- Ссылка на существующее поле
- Поля без разметки
- Создание поля с непрямоугольной областью
- Поля с несколькими областями
- Поля с несколькими экземплярами
- Изменение названия поля
- Копирование, перемещение, удаление полей
- Исключение региона из распознавания
- Мастер создания определения документа
- Редактирование и публикация определения документа
- Настройка сборки многостраничных документов
- Свойства определения документа
- Свойства раздела документа
- Проверка с помощью правил
- Настройка экспорта
- Настройка отображения данных в окне документа
- Тестирование определения документа
- Локализация определения документа
-
Классификация
- Сценарии классификации
- Профили классификации
- Типы ошибок и баланс точности\полноты
-
Настройка классификации во FlexiCapture
- Предварительная настройка
- Загрузка изображений и настройка классификатора
- Обучение классификатора
- Анализ результатов классификации
- Рекомендации по улучшению качества работы классификатора
- Экспорт и подключение классификатора
- Соответствие классов и определений документов
- Классификация документов по справочнику компаний
- Обучение поиску полей
- Работа оператора с настроенным проектом
-
Работа с ABBYY FlexiCapture for Invoices
- Возможности ABBYY FlexiCapture for Invoices
- Процесс ввода инвойсов
-
Настройка проекта для ввода инвойсов
- Настройка стран и языков
- Подключение справочников поставщиков и подразделений компаний
- Настройка экспорта данных
- Статус документа в проекте ABBYY FlexiCapture for Invoices
- Обучение в ABBYY FlexiCapture for Invoices
- Правила
- Извлечение дополнительных полей инвойсов
- Проверка позиций инвойса
- Дополнительные возможности работы операторов
- Использование более одного определения документа
- Редактирование настроек обработки инвойсов в XML
- Обновление определения документа для обработки инвойсов
- Налоговые схемы
- Спецификации
- Обработка чеков в ABBYY FlexiCapture for Invoices
- Обработка заказов в ABBYY FlexiCapture for Invoices
- Обработка документов при помощи NLP
- Интерфейс программы ABBYY FlexiCapture
-
Приложения
-
Использование скриптов в ABBYY FlexiCapture
- Особенности .Net скриптов
- Подключение внешней сборки
- Объектная модель
-
Использование скриптов для настройки этапов обработки
-
Типы скриптов
- Скрипт правила
- Скрипт автозамены
- Скрипт экспорта
- Пользовательский скрипт
- Скрипт сборки документа
- Скрипт пользовательского распознавания
- Скрипт маршрутизации
- Скрипты обработки
- Скрипт обновления набора данных
- Скрипт валидации набора данных
- Скрипт классификации документа
-
Обработчики событий
- Создание пакета
- Удаление пакета
- Изменение свойств пакета
- Изменение состава пакета
- Перемещение страниц
- Открытие/закрытие пакета
- Проверка целостности пакета
- Изменение свойства документа
- Изменение состояния документа
- Скрипт после экспорта
- Скрипт после проверки правил
- Перед наложением определений документов
- Запрос на верификацию поля
-
Объекты
- IActionResult
- IAssemblingError
- IAssemblingErrors
- IBatch
- IBatchCheckResults
- IBatchItem
- IBatchItems
- IBatchTypeClassifier
- IBatchTypeClassifierResult
- IBinarizationParams
- IBoxedBoolean
- ICharacterParams
- ICharactersParams
- ICheckmarkGroupValue
- ICheckmarkValue
- IDataSet
- IDataSetQuery
- IDataSetRecord
- IDocument
- IDocuments
- IDocumentExportResults
- IDocumentsExportResults
- IDocumentDefinitionInfo
- IDocumentDefinitionInfoArray
- IEditablePictureObject
- IExportFieldsToRedact
- IExportImageSavingOptions
- IField
- IFieldRegion
- IFieldRegions
- IFields
- IFlexiCaptureTools
- ILocalContrastParams
- IMatchedSectionInfo
- IMatchingInfo
- IPage
- IPageClassificationResult
- IPages
- IPictureObject
- IPictureObjectsInfo
- IPrincipal
- IPrincipals
- IProcessingCallback
- IProject
- IProperties
- IProperty
- IPropertyModificationInfo
- IRecordCheckResult
- IRecordset
- IRect
- IRects
- IRoutingRuleResult
- IRuleContext
- IRuleError
- IRuleErrors
- IRuleTag
- IRuleTags
- IScriptBinaryAttributes
- IScriptDefinitionContext
- ISectionDefinitionInfo
- ISectionDefinitionInfoArray
- IShadowsHighlightsParams
- IStageInfo
- IUserAttachment
- IUserAttachments
- IUserSessionInfo
- IValue
- IVARIANTArray
- TAssemlingErrorType
- TBatchItemType
- TColorToFilter
- TExportFieldType
- TExportType
- TImageCompressionType
- TPageClassificationType
- TPdfAVersion
- TPdfDocumentInfoType
- TPdfTextSearchAreaType
- TPrincipalType
- TProcessingPriority
- TPropertyType
- TRuleErrorType
- TStateType
- Примеры скриптов
- Внутренние имена языков распознавания
-
Типы скриптов
-
Использование скриптов для обработки событий интерфейса
-
События
- После закрытия документа
- После закрытия проекта
- При активации документа в окне задания
- При активации поля
- При возврате из задания
- При вызове пользовательской команды
- При деактивации поля
- При закрытии документа
- При закрытии задания
- При закрытии проекта
- При изменении региона
- При изменении режима окна задания
- При открытии документа
- При открытии окна задания
- При отмене задания
- При отображении региона
- При отправке задания на этап
- При подтверждении текстового поля
-
Объекты
- IBoolean
- IBoxedFieldControl
- IDocumentEditor
- IDocumentItem
- IDocumentItems
- IDocumentsCollection
- IDocumentsWindow
- IDrawContext
- IErrorControl
- IErrorControls
- IErrorsWindow
- IFieldControl
- IFieldRegionControl
- IFieldRegionControls
- IFormWindow
- IImageWindow
- IMainMenu
- IMainWindow
- IMenu
- IMenuItem
- IPageControl
- IPageItem
- IPageItems
- IPagesCollection
- IPoint
- ISelection
- IShellRational
- IShellRect
- IShellRects
- ITaskWindow
- ITextEditor
- IToolbar
- IToolbarButton
- IToolbars
- TCommandBarType
- TCommandID
- TDockingType
- TDocumentState
- TErrorType
- TSelectionType
- TTaskWindowMode
- TTextSize
- TUserRole
- TWorkWindowType
-
События
- Пользовательский скрипт (Web Custom Action) для Веб-станции Верификации
- Создание машиночитаемых форм
-
Горячие клавиши
- Горячие клавиши на Станции Настройки Проектов
- Горячие клавиши на Станции Верификации
- Горячие клавиши на станции верификации данных
- Горячие клавиши в окне Редактора определения документа
- Горячие клавиши в окне групповой верификации
- Горячие клавиши в окне контекстной верификации
- Настройка горячих клавиш
- Дополнительные настройки
- Описание команд Сервера Обработки
- Встроенные примеры проектов FlexiCapture
- Поддерживаемые языки распознавания
- Поддерживаемые языки классификатора
- Шрифты для корректного отображения символов
- Поддерживаемые типы текста
- Поддерживаемые типы штрих-кодов
- Поддерживамые входные форматы
- Особенности работы с файлами формата PDF
- Форматы файлов экспорта
- Формат отображения даты
- Алфавит, используемый в регулярных выражениях
- Патенты
- Технологии других компаний
- Глоссарий
- Техническая поддержка
- Как купить программу ABBYY FlexiCapture
- Лицензионный договор с конечным пользователем
-
Использование скриптов в ABBYY FlexiCapture
Анализ результатов классификации
После обучения формируется статистика по результатам классификации. Анализ статистики поможет понять, как улучшить качество классификатора.
Открыть окно статистики классификации можно одним из следующих способов:
- нажмите кнопку
Статистика на панели инструментов;
- выберите команду главного меню Обучение классификатора → Просмотр статистики.
В открывшемся окне будет представлена следующая информация:
- F-мера, Полнота и Точность – чем выше эти показатели, тем лучше результаты классификации. (Подробнее о том, как считается F-мера см. Глоссарий, F-мера классификации).
- Количество страниц с эталонными классами
- Результат классификации по страницам:
- Истинно-положительный – количество страниц, которым был присвоен класс, совпадающий с эталонным.
- Ложно-положительный – количество страниц, которым был присвоен класс, не совпадающий с эталонным.
- Ложно-отрицательный – количество страниц, которым не был присвоен класс, но у которых имеется эталонный класс.
- Истинно-отрицательный – количество страниц, которым не был присвоен класс и у которых отсутствует эталонный класс.
С помощью выпадающего списка в левом верхнем углу окна Статистика классификации вы можете выбрать, для каких страниц отображать статистику: с состояниями Для тестирования и Для обучения или с каждым из них по отдельности.
Подробная информация по соотношению эталонных и результирующих классов, а также по результатам обучения классификатора представлена в трех вариантах:
- Матрица путающихся классов. Матрица позволяет визуализировать, документы каких классов чаще всего путаются классификатором. В ячейках матрицы представлено соотношение эталонных и результирующих классов. Зеленым цветом выделены ячейки, показывающие количество страниц, которым был правильно присвоен класс. Красным цветом выделены ячейки, показывающие количество страниц с путающимися классами – классами, которые были неправильно присвоены классификатором страницам с эталонными классами.
Инструменты для работы с Матрицей путающихся классов
- Опция Только путающиеся классы выключает отображение классов, в которых для всех страниц результирующие классы совпали с эталонными.
- Кнопки Страницы и Проценты позволяют переключаться между отображением данных по количеству страниц с правильно определенными и путающимися классами по страницам и процентном соотношении (процент страниц с правильно присвоенным классом относительно всех страниц с таким же эталонным классом).
- Масштаб отображения матрицы можно регулировать:
отображение матрицы в фиксированном масштабе;
отображение всей матрицы целиком;
увеличение масштаба;
уменьшение масштаба;
2. Статистика по классам. Таблица с подробной статистикой по каждому классу. Позволяет идентифицировать классы, вызывающие наибольшее количество ошибок в работе классификатора.
3. Путающиеся классы. На вкладке содержится статистика по страницам, у которых результирующий класс не совпал с эталонным. С помощью этой статистики можно выявить, какие классы наиболее часто путаются друг с другом. Доступна сортировка как по количеству путающихся страниц, так и по процентному соотношению путающихся страниц относительно общего количества страниц с эталонным классом.
Двойной клик по ячейке матрицы или строке в таблицах статистики открывает страницы с выбранными классами. На всех вкладках доступна строка поиска по классам. Также в таблицах статистики доступна сортировка по столбцам для выявления самых проблемных классов.
Для удобства анализа результатов классификации вы можете экспортировать статистику в файл текстового формата. Нажмите Экспортировать статистику... в окне Статистика классификации. В открывшемся окне задайте имя и место хранения экспортируемого файла, выберите формат: Файлы CSV (*.csv) или Текстовые файлы (*.txt). В этом же окне отметьте, какую статистику вы хотите экспортировать (можно выбрать одну или несколько опций):
- Сводная статистика: информация по основным параметрам классификации: F-мера, Полнота, Точность и результат классификации по страницам.
- Статистика по классам: статистика по основным параметрам классификации для каждого класса.
- Путающиеся классы: количество страниц в числах и процентах для каждого путающегося класса.
- Все классы: количество страниц в числах и процентах для каждого класса.
Статистика будет экспортироваться только для страниц с выбранным состоянием документа в окне Статистика классификации.
Внимание! Необходимо заново запустить обучение классификатора, если были выполнены следующие действия:
- добавлены/удалены документы с присвоенным состоянием Для обучения;
- документу было присвоено или удалено состояние Для обучения;
- добавлены, удалены или объединены классы;
- документу был назначен другой эталонный класс;
- изменен профиль классификации и/или приоритет полноты/точности.
1/14/2021 2:17:24 PM