- О программе ABBYY FlexiCapture
- Установка и запуск программы
- Архитектура комплекса ABBYY FlexiCapture
-
Настройка программы
- Настройка программы ABBYY FlexiCapture
- Работа в мультитенантной системе
-
Создание проекта
- Свойства проекта
- Переменные окружения
- Импорт изображений
- Типы пакета
- Настройка процесса обработки
- Инструменты
- Приоритет пакета по умолчанию
- Настройка SLA
- Управление правами пользователей
- Регистрационные параметры
- Загрузка проекта на сервер
- Тестовый проект
- Настройка внешнего вида программы
- Качество отображения изображений
-
Создание определения документа
- Создание определений структурированного документа
- Создание определений для неструктурированных и частично структурированных документов
- Создание определений документов без автоматического извлечения данных
- Комплекты документов
-
Поля определения документа
- Текстовые поля ввода
- Метки
- Группы меток
- Штрих-коды
- Картинки
- Таблицы
- Группы полей
- Служебные поля
- Индексные поля
- Ссылка на существующее поле
- Поля без разметки
- Создание поля с непрямоугольной областью
- Поля с несколькими областями
- Поля с несколькими экземплярами
- Изменение названия поля
- Копирование, перемещение, удаление полей
- Исключение региона из распознавания
- Мастер создания определения документа
- Редактирование и публикация определения документа
- Настройка сборки многостраничных документов
- Свойства определения документа
- Свойства раздела документа
- Проверка с помощью правил
- Настройка экспорта
- Настройка отображения данных в окне документа
- Тестирование определения документа
- Локализация определения документа
-
Классификация
- Сценарии классификации
- Профили классификации
- Типы ошибок и баланс точности\полноты
-
Настройка классификации во FlexiCapture
- Предварительная настройка
- Загрузка изображений и настройка классификатора
- Обучение классификатора
- Анализ результатов классификации
- Рекомендации по улучшению качества работы классификатора
- Экспорт и подключение классификатора
- Соответствие классов и определений документов
- Классификация документов по справочнику компаний
- Обучение поиску полей
- Работа оператора с настроенным проектом
-
Работа с ABBYY FlexiCapture for Invoices
- Возможности ABBYY FlexiCapture for Invoices
- Процесс ввода инвойсов
-
Настройка проекта для ввода инвойсов
- Настройка стран и языков
- Подключение справочников поставщиков и подразделений компаний
- Настройка экспорта данных
- Статус документа в проекте ABBYY FlexiCapture for Invoices
- Обучение в ABBYY FlexiCapture for Invoices
- Правила
- Извлечение дополнительных полей инвойсов
- Проверка позиций инвойса
- Дополнительные возможности работы операторов
- Использование более одного определения документа
- Редактирование настроек обработки инвойсов в XML
- Обновление определения документа для обработки инвойсов
- Налоговые схемы
- Спецификации
- Обработка чеков в ABBYY FlexiCapture for Invoices
- Обработка заказов в ABBYY FlexiCapture for Invoices
- Обработка документов при помощи NLP
- Интерфейс программы ABBYY FlexiCapture
-
Приложения
-
Использование скриптов в ABBYY FlexiCapture
- Особенности .Net скриптов
- Подключение внешней сборки
- Объектная модель
-
Использование скриптов для настройки этапов обработки
-
Типы скриптов
- Скрипт правила
- Скрипт автозамены
- Скрипт экспорта
- Пользовательский скрипт
- Скрипт сборки документа
- Скрипт пользовательского распознавания
- Скрипт маршрутизации
- Скрипты обработки
- Скрипт обновления набора данных
- Скрипт валидации набора данных
- Скрипт классификации документа
-
Обработчики событий
- Создание пакета
- Удаление пакета
- Изменение свойств пакета
- Изменение состава пакета
- Перемещение страниц
- Открытие/закрытие пакета
- Проверка целостности пакета
- Изменение свойства документа
- Изменение состояния документа
- Скрипт после экспорта
- Скрипт после проверки правил
- Перед наложением определений документов
- Запрос на верификацию поля
-
Объекты
- IActionResult
- IAssemblingError
- IAssemblingErrors
- IBatch
- IBatchCheckResults
- IBatchItem
- IBatchItems
- IBatchTypeClassifier
- IBatchTypeClassifierResult
- IBinarizationParams
- IBoxedBoolean
- ICharacterParams
- ICharactersParams
- ICheckmarkGroupValue
- ICheckmarkValue
- IDataSet
- IDataSetQuery
- IDataSetRecord
- IDocument
- IDocuments
- IDocumentExportResults
- IDocumentsExportResults
- IDocumentDefinitionInfo
- IDocumentDefinitionInfoArray
- IEditablePictureObject
- IExportFieldsToRedact
- IExportImageSavingOptions
- IField
- IFieldRegion
- IFieldRegions
- IFields
- IFlexiCaptureTools
- ILocalContrastParams
- IMatchedSectionInfo
- IMatchingInfo
- IPage
- IPageClassificationResult
- IPages
- IPictureObject
- IPictureObjectsInfo
- IPrincipal
- IPrincipals
- IProcessingCallback
- IProject
- IProperties
- IProperty
- IPropertyModificationInfo
- IRecordCheckResult
- IRecordset
- IRect
- IRects
- IRoutingRuleResult
- IRuleContext
- IRuleError
- IRuleErrors
- IRuleTag
- IRuleTags
- IScriptBinaryAttributes
- IScriptDefinitionContext
- ISectionDefinitionInfo
- ISectionDefinitionInfoArray
- IShadowsHighlightsParams
- IStageInfo
- IUserAttachment
- IUserAttachments
- IUserSessionInfo
- IValue
- IVARIANTArray
- TAssemlingErrorType
- TBatchItemType
- TColorToFilter
- TExportFieldType
- TExportType
- TImageCompressionType
- TPageClassificationType
- TPdfAVersion
- TPdfDocumentInfoType
- TPdfTextSearchAreaType
- TPrincipalType
- TProcessingPriority
- TPropertyType
- TRuleErrorType
- TStateType
- Примеры скриптов
- Внутренние имена языков распознавания
-
Типы скриптов
-
Использование скриптов для обработки событий интерфейса
-
События
- После закрытия документа
- После закрытия проекта
- При активации документа в окне задания
- При активации поля
- При возврате из задания
- При вызове пользовательской команды
- При деактивации поля
- При закрытии документа
- При закрытии задания
- При закрытии проекта
- При изменении региона
- При изменении режима окна задания
- При открытии документа
- При открытии окна задания
- При отмене задания
- При отображении региона
- При отправке задания на этап
- При подтверждении текстового поля
-
Объекты
- IBoolean
- IBoxedFieldControl
- IDocumentEditor
- IDocumentItem
- IDocumentItems
- IDocumentsCollection
- IDocumentsWindow
- IDrawContext
- IErrorControl
- IErrorControls
- IErrorsWindow
- IFieldControl
- IFieldRegionControl
- IFieldRegionControls
- IFormWindow
- IImageWindow
- IMainMenu
- IMainWindow
- IMenu
- IMenuItem
- IPageControl
- IPageItem
- IPageItems
- IPagesCollection
- IPoint
- ISelection
- IShellRational
- IShellRect
- IShellRects
- ITaskWindow
- ITextEditor
- IToolbar
- IToolbarButton
- IToolbars
- TCommandBarType
- TCommandID
- TDockingType
- TDocumentState
- TErrorType
- TSelectionType
- TTaskWindowMode
- TTextSize
- TUserRole
- TWorkWindowType
-
События
- Пользовательский скрипт (Web Custom Action) для Веб-станции Верификации
- Создание машиночитаемых форм
-
Горячие клавиши
- Горячие клавиши на Станции Настройки Проектов
- Горячие клавиши на Станции Верификации
- Горячие клавиши на станции верификации данных
- Горячие клавиши в окне Редактора определения документа
- Горячие клавиши в окне групповой верификации
- Горячие клавиши в окне контекстной верификации
- Настройка горячих клавиш
- Дополнительные настройки
- Описание команд Сервера Обработки
- Встроенные примеры проектов FlexiCapture
- Поддерживаемые языки распознавания
- Поддерживаемые языки классификатора
- Шрифты для корректного отображения символов
- Поддерживаемые типы текста
- Поддерживаемые типы штрих-кодов
- Поддерживамые входные форматы
- Особенности работы с файлами формата PDF
- Форматы файлов экспорта
- Формат отображения даты
- Алфавит, используемый в регулярных выражениях
- Патенты
- Технологии других компаний
- Глоссарий
- Техническая поддержка
- Как купить программу ABBYY FlexiCapture
- Лицензионный договор с конечным пользователем
-
Использование скриптов в ABBYY FlexiCapture
Russian (Русский) - Change language
Примеры использования скриптов извлечения
Пример использования скриптов извлечения (C#):
FieldExtractor.ExtractRegularExpression( "(grant(s))|(convey to)|(grant)", "keyWords" ); FieldExtractor.ExtractWordsFromUserDictionary("dictionary", "English"); FieldExtractor.ExtractNerObjects(); // Доступ к выделенным объектам по имени коллекции IExtractedObjects personObjects = FieldExtractor.ExtractedObjects( "NerPerson" ); IExtractedObjects keyWordsObjects = FieldExtractor.ExtractedObjects( "keyWords" ); // Поиск подходящего имени слева от ключевого слова for( int i = 0; i < keyWordsObjects.Count; i++ ) { IExtractedObject keyWord = personObjects.Item( i ); IInterval span = keyWord.Span; IExtractedObject grantor = personObjects.Find( span.StartPos, false ); string grantorName = grantor.Value; if ( grantorName.Length > 2 && grantorName != "Doug Darrell" ) { FieldExtractor.SaveSpanToField( grantor.Span, "NlpField1" ); } } // Доступ к исходному тексту string sourceText = FieldExtractor.SourceText; // Запись в поле любого текстового блока FieldExtractor.SaveTextToField( 0, sourceText.Length - 1, "NlpField2" ); // XML-запрос, который производит поиск словарных словосочетаний длиной в 2 слова string query = "<Request> " + "<Query>" + "<Contain MaxDistance=\"1\">" + "<Required>" + "<Form><Attributes><Attribute>dictionary1</Attribute></Attributes></Form>" + "</Required>" + "<Required>" + "<Form><Attributes><Attribute>dictionary2</Attribute></Attributes></Form>" + "</Required>" + "</Contain>" + "</Query>" + "</Request>"; // Выполнение запроса, получение коллекции результатов и сохранение их в поле FieldExtractor.RunQueryAndSaveToField( query, "query1", "NlpField3"); // Выполнение запроса и получение коллекции результатов IExtractedObjects queryResults1 = FieldExtractor.RunQuery( query, "query2" ); // Другой способ получить доступ к результатам запроса, после его выполнения IExtractedObjects queryResults2 = FieldExtractor.QueryResults( "query2" ); |
Параметры скрипта
Имя | Тип | Права | Значение |
FieldExtractor | IFieldExtractor | Чтение | Выделение полей в тексте документа |
Пример скрипта для извлечения адреса
Скрипт вызван на все поле-источник.
// разделение адреса на составные компоненты this.ParseAddress(); // извлечение найденных компонентов в отдельные поля var zip = this.ExtractedObjects( "NerZipCode" ); var street = this.ExtractedObjects( "NerStreet" ); for( var i = 0; i < zip.Count; i++ ) { this.SaveSpanToField( zip.Item(i).Span, "ZipCode" ); } for( var j = 0; j < street.Count; j++ ) { this.SaveSpanToField( street.Item(j).Span, "Street" ); } |
Пример скрипта для извлечения адреса
Скрипт вызван на часть поля-источника.
// выделение всех NER-объектов в тексте поля или секции this.ExtractNerObjects(); // извлечение объекта типа адрес var address = this.ExtractedObjects( "NerAddress" ); // разделение адреса на компоненты for( var addressSpanIndex = 0; addressSpanIndex < address.Count; addressSpanIndex++ ) { this.SaveSpanToField( address.Item(addressSpanIndex).Span, "Address" ); // присвоение уникального префикса для имени всех коллекций компонент данного адреса var collectionName = "nerAddress" + String(addressSpanIndex); // извлечение адреса this.ParseAddressInPosition( collectionName, address.Item(addressSpanIndex).Span.StartPos, address.Item(addressSpanIndex).Span.EndPos ); // сохранение найденных компонентов в отдельные поля var zip = this.ExtractedObjects( collectionName, "NerZipCode" ); var street = this.ExtractedObjects( collectionName, "NerStreet" ); RunQueryAndSaveToField for( var i = 0; i < zip.Count; i++ ) { this.SaveSpanToField( zip.Item(i).Span, "ZipCode" ); } for( var j = 0; j < street.Count; j++ ) { this.SaveSpanToField( street.Item(j).Span, "Street" ); } } |
14.01.2021 14:17:24