Russian (Русский) - Change language

Предраспознавание изображения

Обработка гибкого документа начинается с предварительного распознавания (или, сокращенно, предраспознавания) всего изображения целиком (полнотекстовое распознавание). В отличие от жестких форм, которые изначально разрабатываются для компьютерного ввода и потому данные в них расположены всегда на одном и том же месте, поля гибких документов могут располагаться по-разному. Поэтому при анализе гибкого документа поиск полей ведется преимущественно на основе результатов предварительного распознавания текста.

Предраспознавание является первым этапом анализа изображения. Поскольку процесс предраспознавания занимает заметное время, то FlexiLayout Studio предоставляет возможность выполнить этап предраспознавания однократно, независимо от наложения гибкого описания. Таким образом, пользователь может сэкономить время и сконцентрировать свое внимание на создании и отладке гибкого описания.

Кроме того, результаты предраспознавания необходимо проанализировать перед тем, как создавать гибкое описание, чтобы оценить их качество. Качество предраспознавания зависит от качества тестовых изображений пакета, т.е. правильности настроек яркости, контраста, разрешения и пр., которые были выбраны при сканировании документов. Если результаты предраспознавания неудовлетворительны, возможно, следует изменить настройки сканера. По той же причине в FlexiLayout Studio допускается добавление в пакет изображений с различным разрешением, чтобы пользователь мог сравнить результаты предраспознавания и наложения гибкого описания для изображений с различным разрешением, после чего выбрать оптимальный режим сканирования.

Кроме того, предраспознавание можно выполнять в быстром или полном режиме (см. раздел Параметры предраспознавания). На этапе разработки гибкого описания необязательно иметь идеальные результаты распознавания. Практически любое поле можно найти при наличии нескольких ошибок в распознанном тексте. Часто бывает важно провести этап предраспознавания за возможно меньшее время, допуская при этом некоторые ошибки. При этом задача правильного и точного распознавания решается на следующем этапе обработки документов в системах потокового ввода форм, которые позволяют настроить отдельные параметры (типы данных) для распознавания каждого найденного поля.

В процессе предраспознавания на основе анализа взаимного расположения точек разного цвета программа выделяет на изображении и классифицирует по типам элементарные объекты изображения, а также объединяет текстовые объекты в слова и строки.

В процессе предраспознавания приложение выделяет объекты изображения следующих типов:

  • Text - текстоподобные объекты,
  • Picture - картинки,
  • Punctuation mark - отдельно стоящие знаки препинания,
  • Inverted text - светлый текст на темном фоне,
  • Separator - разделители,
  • Barcode - штрих-коды,
  • Checkmark - метки в черных квадратных рамках.

После выделения элементарных объектов выполняется распознавание объектов текстового типа. Распознанный текст можно просмотреть в следующих режимах:

  • Recognized Words - распознанные слова;
  • Recognized Lines - распознанные строки.

Подробнее:

Параметры предраспознавания

Запуск предраспознавания. Просмотр результатов

Анализ изображения

01.12.2020 7:04:05


Please leave your feedback about this article