Russian (Русский) - Change language

IFieldExtractor

Назначение

Служит для выделения полей в тексте документа.

Замечание. Может быть изменен только в скрипте извлечения полей.

Определение Описание
ExtractRegularExpression( regularExpression : string, resultCollectionName : string )

Задает регулярное выражение для выделения из текста документа всех интервалов, удовлетворяющих выражению.


Параметр resultCollectionName задает название для результирующей коллекции объектов. Название коллекции можно использовать в XML-запросах к документу. Также по названию можно получить доступ к самой результирующей коллекции.

ExtractNerObjects()

Сообщает механизму, что нужно выделить в тексте документа NER-сущности.
После выделения объектов у механизма будут доступны коллекции с предустановленными названиями: NerPerson, NerOrg, NerGeo, NerAddress, NerMoney, NerDate.

Обратите внимание, что объекты NerMoney и NerDate используются только в скриптах извлечения и не доступны в ABBYY FlexiLayout Studio.

ExtractWordsFromUserDictionary( userDictionaryName : string, languageName : string )

Сообщает механизму, что в тексте документа нужно выделить словоформы из слов пользовательского словаря. Словарь подключается к определению документа на закладке свойств скриптового правила. Обращение к словарю происходит по его имени.


Параметр languageName сообщает, на каком языке следует сгенерировать словоформы для слов пользовательского словаря.

ParseAddress() Разбирает текст поля или секции на составные части адреса.
ParseAddressInPosition( resultCollectionNamePrefix : string, startPos : int, endPos : int ) Разбирает часть текста поля или секции, выделенную между указанными начальной и конечной позициями, на компоненты адреса.
ParseAddressInSpan(resultCollectionNamePrefix : string, span : IInterval ) Разбирает на компоненты адреса часть текста поля или секции, попадающую в указанный интервал.
RunQuery( xmlQuery : string, queryName : string ) : IExtractedObjects

Выполняет XML-запрос к тексту документа и найденным интервалам. Возвращает коллекцию результатов запроса в виде массива интервалов найденных результирующих строк в тексте документа.

Параметр queryName задает название запроса, по которому можно получить у механизма результирующую коллекцию.

RunQueryAndSaveToField( xmlQuery : string, queryName : string, fieldName : string ) Выполняет XML-запрос к тексту документа и найденным интервалам и сохраняет результаты в указанное поле документа.
SaveSpanToField( span : IInterval, fieldName  : string ) Сохраняет фрагмент текста, соответствующий заданному интервалу подстроки текста, в указанное поле документа.
SaveTextToField( startPos : int, endPos : int, fieldName : string ) Сохраняет фрагмент текста, соответствующий заданным позициям начала и конца подстроки текста, в указанное поле документа.
ExtractedObjects( collectionName : string,  [optional] objectTypeName : VARIANT) : IExtractedObjects

Предоставляет доступ к коллекции выделенных в тексте объектов по названию коллекции.

Для коллекций NER-объектов, выделенных как компоненты адреса, нужно:

  • в качестве collectionName  задать имя, переданное как resultCollectionNamePrefix  в методы ParseAddress..., и дополнительно указать objectTypeName в виде имени типа коллекции, например, «NerStreet» или «NerCity».
  • Или задать collectionName  в виде [resultCollectionNamePrefix ]_[ objectTypeName], не указывая objectTypeName в опциональном аргументе.
QueryResults( queryName : string ) : IExtractedObjects Предоставляет доступ к результатам XML-запроса по названию запроса.

Свойства

Имя Тип Права Значение
SourceText() string Чтение Текст документа или поля, на котором запускается механизм выделения полей
SourceNode() IField Чтение Поле, на котором запускается механизм
SourceDocument() IDocument Чтение Документ, содержащий SourceNode.

1/14/2021 2:17:24 PM


Please leave your feedback about this article