Russian (Русский) - Change language

Параметры предраспознавания

При создании гибкого описания/классификатора пользователь задаёт свойства гибкого описания или классификатора, в число которых входят параметры предварительного распознавания (предраспознавания).

К параметрам предраспознавания относятся язык(и) распознавания, тип текста, режим и область предварительного распознавания. Правильно заданные параметры помогут создать качественное гибкое описание/классификатор, с помощью которого в дальнейшем будут обрабатываться формы текущего типа.

Чтобы задать параметры предраспознавания, выполните следующие действия:

  • выберите пункт Properties... меню FlexiLayout / Classifier или контекстного меню гибкого описания/классификатора;
  • нажмите кнопку Advanced Pre-recognition Properties... на вкладке General диалога Properties of %Name%.

В диалоге Pre-recognition Properties укажите следующие параметры:

Опция Описание
Вкладка General
Name

Способ печати бланка формы:

  • типографский (Typographic),
  • матричный принтер (Matrix printer),
  • пишущая машинка (Typewriter).

Для выбора значения данного параметра необходимо оценить тип и качество печати.

Pre-recognition mode

Режим распознавания: быстрый (Fast), улучшенный (Balanced) или полный (Thorough).

В быстром режиме цветные и полутоновые изображения перед распознаванием бинаризуются (переводятся в черно-белые). Распознавание в быстром режиме занимает меньше времени (что ускоряет обработку форм), при этом для большинства форм распознавание в быстром режиме дает удовлетворительные результаты.

В режиме Balanced распознавание осуществляется с учетом цвета. Распознавание в этом режиме происходит медленнее, чем в режиме Fast, но дает более высокие результаты.

Полный режим рекомендуется в том случае, если предраспознавание в других режимах приводит к большому количеству ошибок.

По умолчанию используется режим Balanced.

Вкладка Languages
Text languages Языки, на которых написан текст документа формы. Из выпадающего списка необходимо выбрать один или несколько языков, на котором написан текст формы. Полный перечень языков см. в разделе Список OCR языков, поддерживаемых программой ABBYY FlexiLayout™ Studio.
User dictionaries Пользовательский словарь. Подключается к предустановленным словарям с целью улучшения качества распознавания документов за счет добавления в словарь специализированных терминов, аббревиатур, названий компаний и т. д.
Вкладка Advanced
Barcodes

Параметры обработки штрих-кодов:

  • Thorough extraction mode – тщательное распознавание штрих-кодов.
    Внимание! Замедляет процесс распознавания. Рекомендуется использовать если часть штрих-кодов не была найдена на изображении.
  • Extract 2D barcodes: Data Matrix, Aztec, QR Code – отметьте эту опцию, если ваши изображения содержат штрих-коды указанных типов. Если эта опция не выбрана, штрих-коды типа Data Matrix, Aztec и QR Code не будут найдены на изображениях и эти типы штрих-кодов будут недоступны в свойствах элемента Barcode.
CJK

Распознавание языков группы CJK (китайский, японский, корейский).

  • Separated furigana mode – выберите данную опцию для улучшения распознавания фонетических подсказок (фуригана) в японском языке.
NER recognition

Extract named entities – для извлечения значимой информации из поля или группы полей при помощи методов NLP.

Замечание. Опция доступна только при наличии лицензии, включающей в себя модуль NLP.

Vertical text extraction

Параметры извлечения вертикального текста. Выберите один из следующих параметров:

  • Extract for all languages – для нахождения вертикально ориентированного текста во всех языках.
  • Do not extract – чтобы исключить нахождение вертикально ориентированного текста.
  • Extract for CJK languages – для нахождения вертикально ориентированного текста в языках группы CJK (китайский, японский, корейский).
Pre-recognition area Область предраспознавания. Позволяет задать прямоугольную область предраспознавания на странице. Для этого укажите величину отступа границ прямоугольника от границ страницы.
User pattern Пользовательский эталон распознавания, созданный в программе ABBYY FineReader Professional/Corporate Edition 9.0. Рекомендуется использовать, если в исходном документе встречаются нестандартные шрифты или специальные символы.

10.11.2020 12:08:08


Please leave your feedback about this article