- О программе ABBYY FlexiCapture
- Установка и запуск программы
- Архитектура комплекса ABBYY FlexiCapture
-
Настройка программы
- Настройка программы ABBYY FlexiCapture
- Работа в мультитенантной системе
-
Создание проекта
- Свойства проекта
- Переменные окружения
- Импорт изображений
- Типы пакета
- Настройка процесса обработки
- Инструменты
- Приоритет пакета по умолчанию
- Настройка SLA
- Управление правами пользователей
- Регистрационные параметры
- Загрузка проекта на сервер
- Тестовый проект
- Настройка внешнего вида программы
- Качество отображения изображений
-
Создание определения документа
- Создание определений структурированного документа
- Создание определений для неструктурированных и частично структурированных документов
- Создание определений документов без автоматического извлечения данных
- Комплекты документов
-
Поля определения документа
- Текстовые поля ввода
- Метки
- Группы меток
- Штрих-коды
- Картинки
- Таблицы
- Группы полей
- Служебные поля
- Индексные поля
- Ссылка на существующее поле
- Поля без разметки
- Создание поля с непрямоугольной областью
- Поля с несколькими областями
- Поля с несколькими экземплярами
- Изменение названия поля
- Копирование, перемещение, удаление полей
- Исключение региона из распознавания
- Мастер создания определения документа
- Редактирование и публикация определения документа
- Настройка сборки многостраничных документов
- Свойства определения документа
- Свойства раздела документа
- Проверка с помощью правил
- Настройка экспорта
- Настройка отображения данных в окне документа
- Тестирование определения документа
- Локализация определения документа
-
Классификация
- Сценарии классификации
- Профили классификации
- Типы ошибок и баланс точности\полноты
-
Настройка классификации во FlexiCapture
- Предварительная настройка
- Загрузка изображений и настройка классификатора
- Обучение классификатора
- Анализ результатов классификации
- Рекомендации по улучшению качества работы классификатора
- Экспорт и подключение классификатора
- Соответствие классов и определений документов
- Классификация документов по справочнику компаний
- Обучение поиску полей
- Работа оператора с настроенным проектом
-
Работа с ABBYY FlexiCapture for Invoices
- Возможности ABBYY FlexiCapture for Invoices
- Процесс ввода инвойсов
-
Настройка проекта для ввода инвойсов
- Настройка стран и языков
- Подключение справочников поставщиков и подразделений компаний
- Настройка экспорта данных
- Статус документа в проекте ABBYY FlexiCapture for Invoices
- Обучение в ABBYY FlexiCapture for Invoices
- Правила
- Извлечение дополнительных полей инвойсов
- Проверка позиций инвойса
- Дополнительные возможности работы операторов
- Использование более одного определения документа
- Редактирование настроек обработки инвойсов в XML
- Обновление определения документа для обработки инвойсов
- Налоговые схемы
- Спецификации
- Обработка чеков в ABBYY FlexiCapture for Invoices
- Обработка заказов в ABBYY FlexiCapture for Invoices
- Обработка документов при помощи NLP
- Интерфейс программы ABBYY FlexiCapture
-
Приложения
-
Использование скриптов в ABBYY FlexiCapture
- Особенности .Net скриптов
- Подключение внешней сборки
- Объектная модель
-
Использование скриптов для настройки этапов обработки
-
Типы скриптов
- Скрипт правила
- Скрипт автозамены
- Скрипт экспорта
- Пользовательский скрипт
- Скрипт сборки документа
- Скрипт пользовательского распознавания
- Скрипт маршрутизации
- Скрипты обработки
- Скрипт обновления набора данных
- Скрипт валидации набора данных
- Скрипт классификации документа
-
Обработчики событий
- Создание пакета
- Удаление пакета
- Изменение свойств пакета
- Изменение состава пакета
- Перемещение страниц
- Открытие/закрытие пакета
- Проверка целостности пакета
- Изменение свойства документа
- Изменение состояния документа
- Скрипт после экспорта
- Скрипт после проверки правил
- Перед наложением определений документов
- Запрос на верификацию поля
-
Объекты
- IActionResult
- IAssemblingError
- IAssemblingErrors
- IBatch
- IBatchCheckResults
- IBatchItem
- IBatchItems
- IBatchTypeClassifier
- IBatchTypeClassifierResult
- IBinarizationParams
- IBoxedBoolean
- ICharacterParams
- ICharactersParams
- ICheckmarkGroupValue
- ICheckmarkValue
- IDataSet
- IDataSetQuery
- IDataSetRecord
- IDocument
- IDocuments
- IDocumentExportResults
- IDocumentsExportResults
- IDocumentDefinitionInfo
- IDocumentDefinitionInfoArray
- IEditablePictureObject
- IExportFieldsToRedact
- IExportImageSavingOptions
- IField
- IFieldRegion
- IFieldRegions
- IFields
- IFlexiCaptureTools
- ILocalContrastParams
- IMatchedSectionInfo
- IMatchingInfo
- IPage
- IPageClassificationResult
- IPages
- IPictureObject
- IPictureObjectsInfo
- IPrincipal
- IPrincipals
- IProcessingCallback
- IProject
- IProperties
- IProperty
- IPropertyModificationInfo
- IRecordCheckResult
- IRecordset
- IRect
- IRects
- IRoutingRuleResult
- IRuleContext
- IRuleError
- IRuleErrors
- IRuleTag
- IRuleTags
- IScriptBinaryAttributes
- IScriptDefinitionContext
- ISectionDefinitionInfo
- ISectionDefinitionInfoArray
- IShadowsHighlightsParams
- IStageInfo
- IUserAttachment
- IUserAttachments
- IUserSessionInfo
- IValue
- IVARIANTArray
- TAssemlingErrorType
- TBatchItemType
- TColorToFilter
- TExportFieldType
- TExportType
- TImageCompressionType
- TPageClassificationType
- TPdfAVersion
- TPdfDocumentInfoType
- TPdfTextSearchAreaType
- TPrincipalType
- TProcessingPriority
- TPropertyType
- TRuleErrorType
- TStateType
- Примеры скриптов
- Внутренние имена языков распознавания
-
Типы скриптов
-
Использование скриптов для обработки событий интерфейса
-
События
- После закрытия документа
- После закрытия проекта
- При активации документа в окне задания
- При активации поля
- При возврате из задания
- При вызове пользовательской команды
- При деактивации поля
- При закрытии документа
- При закрытии задания
- При закрытии проекта
- При изменении региона
- При изменении режима окна задания
- При открытии документа
- При открытии окна задания
- При отмене задания
- При отображении региона
- При отправке задания на этап
- При подтверждении текстового поля
-
Объекты
- IBoolean
- IBoxedFieldControl
- IDocumentEditor
- IDocumentItem
- IDocumentItems
- IDocumentsCollection
- IDocumentsWindow
- IDrawContext
- IErrorControl
- IErrorControls
- IErrorsWindow
- IFieldControl
- IFieldRegionControl
- IFieldRegionControls
- IFormWindow
- IImageWindow
- IMainMenu
- IMainWindow
- IMenu
- IMenuItem
- IPageControl
- IPageItem
- IPageItems
- IPagesCollection
- IPoint
- ISelection
- IShellRational
- IShellRect
- IShellRects
- ITaskWindow
- ITextEditor
- IToolbar
- IToolbarButton
- IToolbars
- TCommandBarType
- TCommandID
- TDockingType
- TDocumentState
- TErrorType
- TSelectionType
- TTaskWindowMode
- TTextSize
- TUserRole
- TWorkWindowType
-
События
- Пользовательский скрипт (Web Custom Action) для Веб-станции Верификации
- Создание машиночитаемых форм
-
Горячие клавиши
- Горячие клавиши на Станции Настройки Проектов
- Горячие клавиши на Станции Верификации
- Горячие клавиши на станции верификации данных
- Горячие клавиши в окне Редактора определения документа
- Горячие клавиши в окне групповой верификации
- Горячие клавиши в окне контекстной верификации
- Настройка горячих клавиш
- Дополнительные настройки
- Описание команд Сервера Обработки
- Встроенные примеры проектов FlexiCapture
- Поддерживаемые языки распознавания
- Поддерживаемые языки классификатора
- Шрифты для корректного отображения символов
- Поддерживаемые типы текста
- Поддерживаемые типы штрих-кодов
- Поддерживамые входные форматы
- Особенности работы с файлами формата PDF
- Форматы файлов экспорта
- Формат отображения даты
- Алфавит, используемый в регулярных выражениях
- Патенты
- Технологии других компаний
- Глоссарий
- Техническая поддержка
- Как купить программу ABBYY FlexiCapture
- Лицензионный договор с конечным пользователем
-
Использование скриптов в ABBYY FlexiCapture
Свойства распознавания текстового поля
Свойства распознавания задаются на вкладке Распознавание диалога задания свойств поля (пункт Cвойства... контекстного меню поля). Правильно определенные свойства поля значительно повысят качество распознавания и снизят вероятность появления ошибок.
В выпадающем списке Тип заполнения выберите один из режимов распознавания: Стандартное распознавание, Не распознавать или Распознавание с помощью скрипта.
Для режима Стандартное распознавание укажите следующие опции:
- ICR (рукопечатный) – отметьте эту опцию, если текст в данном поле будет написан от руки. Стиль написания может сильно отличаться в разных странах, поэтому нужно задать страну для определения характерного стиля написания.
Показать примеры разных стилей написания цифр
русская двойка американская двойка обычная пятерка – может встретиться в любом стиле японская пятерка русская единица немецкая единица обычная девятка – может встретиться в любом стиле чешская девятка с кольцом справа американская девятка без крючка внизу
- OCR (печатный) – отметьте эту опцию, если текст в данном поле будет напечатан. В выпадающем списке выберите стиль печати (типографским способом, на матричном принтере, печатной машинке и т.д.). См. Поддерживаемые типы текста.
- Дополнительно – используйте эту опцию для выбора нескольких типов или задания пользовательского типа текста.
При выборе данной опции также можно подключить файл эталона в формате PTN. Вы можете создавать пользовательские эталоны в программах ABBYY FineReader Professional/Corporate Edition 9.0 (или более ранние версии) и ABBYY FineReader Engine 9.0 (или более ранние версии).
Пользовательский эталон распознавания
Эталон — это набор пар «изображение символа — сам символ», созданных при распознавании с обучением. Пользовательский эталон используется как источник дополнительной информации при распознавании. Распознавание с обучением полезно в случае:
- распознавания текста, при наборе которого использовались декоративные шрифты;
- распознавания текста, содержащего специальные символы (например, математические знаки);
- распознавания большого по объему (более 1000 страниц) текста с низким качеством печати.
Внимание! Для азиатских языков обучение пользовательских эталонов не поддерживается.
Для подключения эталона нажмите Изменить..., в открывшемся диалоге отметьте опцию По эталону и укажите путь к файлу эталона.
- Тип разметки – выберите тип разметки. Выбор облегчают образцы разметки в выпадающем списке. Если разметка исчезает при сканировании, то рекомендуемый тип разметки является моноширинным (Gray boxes), а если разметка не исчезает при сканировании и разделена на ячейки для знакомест, то обязательно нужно ввести общее число ячеек. При автоматическом нахождении полей с такой разметкой, число ячеек также определяется автоматически.
- Регистр – выберите регистр букв в поле. Если поле может быть заполнено как строчными, так и заглавными буквами, оставьте значение Любой.
- Ориентация – задайте ориентацию текста.
- Направление иероглифического текста – выберите из выпадающего списка, в каком направлении будет распознаваться текст для языков группы CJK (китайский, японский, корейский): автоматически, горизонтально или вертикально. Для полей, не содержащих иероглифического текста, рекомендуется оставить автоматический выбор направления, заданный по умолчанию.
- Для однострочного поля отметьте опцию Однострочное.
- Для поля, значение которого всегда будет состоять из одного слова, отметьте опцию Одно слово. Отметьте эту опцию, если вы хотите, чтобы регулярное выражение применялось ко всему полю, независимо от того, содержит ли поле одно слово или несколько.
Замечание. При включенной опции Одно словоне рекомендуется заносить в пользовательский словарь выражения, содержащие символ пробела.
Задайте параметры предварительной обработки изображений:
- Инвертировать – в процессе распознавания заменить цвет и яркость изображения на противоположные.
- Автоопределение - определять цвета фона и цвет шрифта, при необходимости инвертировать. Рекомендуется использовать при обработке документов, на которых встречается как текст, написанный светлым шрифтом на тёмном фоне, так и текст, написанный тёмным шрифтом на светлом фоне.
- Инверсия - инвертировать изображение полностью.
- Не инвертировать - не изменять изображение (по умолчанию).
- Удалять текстуру – удалять текстуру.
- Очищать изображение – отметьте эту опцию, чтобы производилось очищение изображения от "мусора".
- Чистить мусор только определенного размера – отметьте эту опцию, если вы хотите производить очистку "мусора" определенного размера. Задайте размер "мусора". Если эта опция не отмечена, а отмечена только опция Очищать изображение, размер "мусора" будет подбираться автоматически.
Выберите режим Не распознавать если это поле по каким-либо причинам не может быть распознано (например, если текст в поле написан слитными буквами), и его значение будет вводиться вручную оператором. В этом случае не нужно вводить другие свойства распознавания, так как такое поле распознаваться не будет, а при проверке оператору будет предложено ввести значение поля.
Выберите режим Распознавание с помощью скрипта, если при распознавании вы хотите применять пользовательский алгоритм. Подробнее см. Скрипт пользовательского распознавания.
1/14/2021 2:17:24 PM