Russian (Русский) - Change language

Пример 2. Шаг 6: Создание идентификационного элемента

При обработке гибких документов в программе ABBYY FlexiCapture хотелось бы по возможности полностью исключить случайное распознавание форм, не относящихся к заданному типу. Одним из способов идентификации документов является задание, по крайней мере, одного обязательного элемента.

В нашем случае в качестве идентификатора будем использовать четкий, хорошо распознающийся текст заголовка документа.

Замечание. Идентификационный элемент или идентификационный набор элементов можно описать в предопределенном составном элементе Header. (В данном примере не рассматривается).

Заголовок документа нам понадобится исключительно для идентификации документа, и он не будет впоследствии распознаваться в программе ABBYY FlexiCapture. Для его нахождения создадим в гибком описании элемент типа Static text.

Для того чтобы создать элемент:

  1. Перейдите в окно FlexiLayout в главном окне программы ABBYY FlexiLayout Studio.
  2. В ветви элементов выделите SearchElements.
  3. Выберите команду Add Element (меню FlexiLayout → Add Element → Static Text или в локальном меню элемента).
  4. Задайте имя элемента, например FormHeader, в поле Name.
  5. Выберите пункт Required element на вкладке General (поскольку данный элемент мы решили сделать обязательным).

    Показать пример

  1. Перейдите на вкладку Static Text.

    Показать пример

  1. В поле Search text укажите значение искомого текста.
    Как можно видеть, в пакете присутствуют тестовые изображения, содержащие в заголовке разный текст: Easiest Recipes и Easy to cook Recipes. В качестве значения зададим оба варианта текста заголовка.
    На всех тестовых изображениях заголовок формы однострочный. Поэтому в качестве искомого текста мы можем задать оба варианта текста заголовка без пробелов. Это позволит ускорить поиск однострочного статического текста. Для обозначения выбора из нескольких вариантов между ними ставится значок «|».
  2. Задайте максимально допустимое количество ошибок в искомой фразе в процентах или в явной форме (числом). Зададим в поле Max error percentage максимально допустимый процент ошибок 20. Таким образом, для нашего искомого заголовка в 14/17 символов мы допускаем 2/3 ошибки.

Замечание. Значение допустимого числа ошибок подбирается опытным путем.

10.11.2020 12:08:08


Please leave your feedback about this article