Russian (Русский) - Change language

Свойства распознавания текстового поля

Свойства распознавания задаются на вкладке Распознавание диалога задания свойств поля (пункт Cвойства... контекстного меню поля). Правильно определенные свойства поля значительно повысят качество распознавания и снизят вероятность появления ошибок.

В выпадающем списке Тип заполнения выберите один из режимов распознавания: Стандартное распознавание, Не распознавать или Распознавание с помощью скрипта.

Для режима Стандартное распознавание укажите следующие опции:

  • ICR (рукопечатный) – отметьте эту опцию, если текст в данном поле будет написан от руки.  Стиль написания может сильно отличаться в разных странах, поэтому нужно задать страну для определения характерного стиля написания.

    Показать примеры разных стилей написания цифр

  • OCR (печатный) – отметьте эту опцию, если текст в данном поле будет напечатан. В выпадающем списке выберите стиль печати (типографским способом, на матричном принтере, печатной машинке и т.д.). См. Поддерживаемые типы текста.
  • Дополнительно – используйте эту опцию для выбора нескольких типов или задания пользовательского типа текста.
    При выборе данной опции также можно подключить файл эталона в формате PTN. Вы можете создавать пользовательские эталоны в программах ABBYY FineReader Professional/Corporate Edition 9.0 (или более ранние версии) и ABBYY FineReader Engine 9.0 (или более ранние версии).


Пользовательский эталон распознавания

Для подключения эталона нажмите Изменить..., в открывшемся диалоге отметьте опцию По эталону и укажите путь к файлу эталона.

  • Тип разметки – выберите тип разметки. Выбор облегчают образцы разметки в выпадающем списке. Если разметка исчезает при сканировании, то рекомендуемый тип разметки является моноширинным (Gray boxes), а если разметка не исчезает при сканировании и разделена на ячейки для знакомест, то обязательно нужно ввести общее число ячеек. При автоматическом нахождении полей с такой разметкой, число ячеек также определяется автоматически.
  • Регистр – выберите регистр букв в поле. Если поле может быть заполнено как строчными, так и заглавными буквами, оставьте значение Любой.
  • Ориентация – задайте ориентацию текста.
  • Направление иероглифического текста – выберите из выпадающего списка, в каком направлении будет распознаваться текст для языков группы CJK (китайский, японский, корейский): автоматически, горизонтально или вертикально. Для полей, не содержащих иероглифического текста, рекомендуется оставить автоматический выбор направления, заданный по умолчанию.
  • Для однострочного поля отметьте опцию Однострочное.
  • Для поля, значение которого всегда будет состоять из одного слова, отметьте опцию Одно слово. Отметьте эту опцию, если вы хотите, чтобы регулярное выражение применялось ко всему полю, независимо от того, содержит ли поле одно слово или несколько.
    Замечание. При включенной опции Одно словоне рекомендуется заносить в пользовательский словарь выражения, содержащие символ пробела.

Задайте параметры предварительной обработки изображений:

  • Инвертировать – в процессе распознавания заменить цвет и яркость изображения на противоположные.
    • Автоопределение - определять цвета фона и цвет шрифта, при необходимости инвертировать. Рекомендуется использовать при обработке документов, на которых встречается как текст, написанный светлым шрифтом на тёмном фоне, так и текст, написанный тёмным шрифтом на светлом фоне.
    • Инверсия - инвертировать изображение полностью.
    • Не инвертировать - не изменять изображение (по умолчанию).
  • Удалять текстуру – удалять текстуру.
  • Очищать изображение – отметьте эту опцию, чтобы производилось очищение изображения от "мусора".
  • Чистить мусор только определенного размера – отметьте эту опцию, если вы хотите производить очистку "мусора" определенного размера. Задайте размер "мусора". Если эта опция не отмечена, а отмечена только опция Очищать изображение, размер "мусора" будет подбираться автоматически.

Выберите режим Не распознавать если это поле по каким-либо причинам не может быть распознано (например, если текст в поле написан слитными буквами), и его значение будет вводиться вручную оператором. В этом случае не нужно вводить другие свойства распознавания, так как такое поле распознаваться не будет, а при проверке оператору будет предложено ввести значение поля.

Выберите режим Распознавание с помощью скрипта, если при распознавании вы хотите применять пользовательский алгоритм. Подробнее см. Скрипт пользовательского распознавания.

1/14/2021 2:17:24 PM


Please leave your feedback about this article