Russian (Русский) - Change language

Механизм слияния результатов наложения гибких описаний

Данная статья описывает очередность наложения и механизм выбора регионов полей из гибких описаний.

ABBYY FlexiCapture for Invoices при наложении определения документов для инвойсов может использовать несколько гибких описаний:

  1. Общее гибкое описание, которое используется для обработки всего потока инвойсов, может состоять из двух:

     a. Основное гибкое описание, с помощью которого извлекаются стандартные поля инвойсов, предусмотренные программой. Данное гибкое описание поставляется вместе с ABBYY FlexiCapture for Invoices и не может быть изменено пользователем.

     b. Дополнительное гибкое описание, с помощью которого извлекаются поля, определённые пользователем, а также стандартные поля, логику извлечения которых пользователь переопределил. Данное гибкое описание может быть разработано пользователем.

  2. Разновидность гибкого описания, которая используется для обработки разновидности инвойсов, т.е. документов от конкретного поставщика. Данное гибкое описание может извлекать любые поля, которые есть в определении документов инвойсов. Описание может быть разработано пользователем или получено автоматически в результате обучения на инвойсах конкретного поставщика.

Результат наложения определения документа представляет собой набор регионов полей, которые фактически взяты из разных гибких описаний.

1. Наложение Общего гибкого описания

  A. Первым накладывается основная часть общего гибкого описания — Основное гибкое описание.

Настройки предраспознавания

Изображение документа предраспознаётся с использованием настроек, указанных в определении документа:

    • список языков задаётся в свойствах определения документа, вкладка Настройки определения документов, группа Страны и языки.
    • режим предраспознавания (Очень быстрый/ Быстрый/ Сбалансированный/ Полный) задаётся в свойствах определения документа на вкладке Гибкое описание.

Результат наложения Основного гибкого описания

Результатом наложения являются:

      • идентификатор поставщика и подразделения компании, если их удалось определить.
      • регионы стандартных полей (см. Список извлекаемых полей).

B. Вторым накладывается дополнительная часть общего гибкого описания, если она есть, — Дополнительное гибкое описание.

Настройки предраспознавания

Изображение документа предраспознаётся с использованием настроек (список языков и режим предраспознавания), указанных непосредственно в самом гибком описании. Рекомендуется использовать в дополнительном гибком описании настройки предраспознавания аналогичные указанным в определении документов, в этом случае повторного предраспознавания не происходит, а используется результат предраспознавания, описанный в шаге 1A.

Использование в дополнительном гибком описании настроек предраспознавания, отличных от определения документа, может быть необходимо для обработки специфичных полей, но негативно сказывается на скорости.

Результат наложения Дополнительного гибкого описания

Результатом наложения являются регионы всех полей, которые определены в дополнительном гибком описании: это могут быть как стандартные поля, механизм поиска которых необходимо изменить, так и дополнительные по отношению к основному гибкому описанию поля.

  C. Далее формируется результат наложения Общего гибкого описания. В случае, если в определении документа есть дополнительное гибкое описание, на данном шаге происходит слияние результатов наложения основного и дополнительного гибких описаний.

Поля идентифицируются по именам. Результатом является сумма уникальных полей из основного и дополнительного гибких описаний. В случае наличия полей с одинаковым именем в основном и дополнительном гибких описаниях регион поля берётся из дополнительного гибкого описания.

Такой подход позволяет как добавлять новые поля, так и изменять логику извлечения стандартных полей с помощью дополнительного гибкого описания.

2. Наложение Разновидности гибкого описания

Если при наложении общего гибкого описания на шаге 1 удалось определить поставщика и для данного поставщика существует Разновидность гибкого описания, то на данном шаге накладывается оно.

Настройки предраспознавания

Настройки предраспознавания берутся из определения документа и соответствуют настройкам, использованным при наложении основной части общего гибкого описания. Поэтому дополнительное предраспознавание изображений не требуется.

Результат наложения Разновидности гибкого описания

Результатом наложения являются регионы всех полей, которые определены в Разновидности гибкого описания для конкретного поставщика. Важно отметить, что в случае автоматического создания Разновидности гибкого описания с помощью обучения в ней содержатся все поля определения документа. Если разновидность гибкого описания была разработана вручную, то в ней необходимо оставлять только те поля, которые требуется накладывать специфично для данного поставщика.

3. Результат наложения определения документа

На данном шаге результат наложения Общего гибкого описания объединяется с результатом наложения Разновидности гибкого описания.

Если Разновидность гибкого описания была создана автоматически в результате обучения, то она содержит все поля определения документа. В определении документа хранится информация о том, регионы каких полей приходилось изменять пользователям при обучении, т.е. какие поля работали с недостаточным качеством в общем гибком описании для данного поставщика. На основании этой информации принимается решение о том, регионы каких полей необходимо взять из общего гибкого описания, а каких из обученного для данной разновидности документов, т.е. для данного поставщика.

Замечание. Особый алгоритм выбора региона используется для полей группы Amount. При наложении общего гибкого описания у группы Amount выставляется свойство уверенности найденных регионов. В случае, если регионы найдены неуверенно, поле Total будет требовать верификации. При наличии обученной разновидности гибкого описания для поставщика регионы группы полей Amount берутся из обученной разновидности в случаях, если общее гибкое описание не нашло поля группы или нашло их неуверенно. Если же вы хотите, чтобы регионы группы полей Amount брались из обученной разновидности всегда, тогда необходимо задать ключу [HKEY_CURRENT_USER\Software\ABBYY\FlexiCapture\12.0\DAForms\]”UseTrainedInvoiceAmounts” значение true (по умолчанию ключ имеет значение false).

Если разновидность гибкого описания была разработана вручную, то регионы всех полей, которые присутствуют в разновидности гибкого описания, в итоговом наложении определения документа будут взяты оттуда. Остальные поля — из общего гибкого описания.

Информация о том, из какого гибкого описания были взяты регионы полей, записывается в лог задачи распознавания документа.

Пример

14.01.2021 14:17:24


Please leave your feedback about this article