Russian (Русский) - Change language

Создание гибкого описания FlexiLayout

Гибкое описание FlexiLayout - это формализованное описание структуры документа, позволяющее обнаружить на изображении документа объекты, подлежащие распознаванию.

Условия поиска объектов изображения задаются с помощью элементов . Для каждого объекта или группы объектов, которые необходимо найти на изображении, в гибком описании создается элемент, свойства которого полностью описывают тип (текст, картинка или штрих-код) искомого объекта, его характеристики (длина, ширина и т.д.) и область поиска, в которой предположительно находится объект.

Блок гибкого описания указывает положение объектов изображения, из которых необходимо извлечь данные. Цель гибкого описания - нахождение блоков. Координаты блока могут быть заданы с помощью элемента(ов), а также могут быть указаны непосредственно.

Благодаря наглядности и понятности интерфейса программы ABBYY FlexiLayout Studio создание отдельных элементов и блоков не представляет сложности. Cоздание гибкого описания, т.е. описания структуры всего документа, включает в себя большой элемент творчества, так как зачастую один и тот же объект изображения может быть найден разными способами, и выбор наиболее надежного и эффективного пути поиска является задачей пользователя.

В общем случае процесс создания гибкого описания можно разделить на несколько этапов. Это деление условно, но служит хорошей иллюстрацией.

Создание проекта FlexiLayout Studio

Проект - это файл, создаваемый программой ABBYY FlexiLayout™ Studio и содержащий всю информацию о гибком описании FlexiLayout. В рамках проекта создаются гибкое описание FlexiLayout и пакет тестовых изображений, в созданное гибкое описание добавляются элементы и блоки. Также проект позволяет отладить, скомпилировать гибкое описание и протестировать его.

Подробнее...

Составление пакета изображений

Пакет изображений включает в себя набор тестовых изображений, он должен по возможности охватывать все разнообразие форм, которые впоследствии будут обрабатываться с помощью данного гибкого описания.

Подробнее...

Предраспознавание

В процессе предраспознавания изображений программа FlexiLayout Studio выделяет на изображении и классифицирует по типам элементарные объекты изображения, такие, как текст, разделители, метки и т.д. По результатам предварительного распознавания можно судить о том, что же фактически может быть найдено на форме.

Подробнее...

Анализ результатов распознавания

На данном этапе необходимо просмотреть все изображения и выделить наиболее надежные объекты изображения:

  • объекты, расположение которых одинаково на всех формах. Это могут быть логотипы, заголовки и т.п.;
  • объекты надежно распознаваемые и присутствующие на всех изображениях;
  • объекты, мало зависящие от качества печати и сканирования;

При наличии достаточного количества таких однозначно идентифицируемых и уверенно распознаваемых объектов становится возможным описание расположения всех остальных объектов изображения. Здесь же можно выбрать пути поиска того или иного поля данных, т.е. выбрать опорные объекты изображения, относительно которых можно описать положение искомого объекта.

Подробнее...

Создание элементов и блоков гибкого описания FlexiLayout

Сначала создаются элементы, описывающие объекты, которые могут быть найдены независимо от наличия или отсутствия других объектов. Например, заголовок или иной объект, который обязательно присутствует на форме. Затем положение остальных объектов описывается относительно уже созданных элементов. Так формируется дерево элементов: от более надежного объекта к менее надежному.

Если на форме присутствуют объект(ы), отличающие форму данного типа от других форм, соответствующие им элементы следует указать первыми. Наличие на формах таких объектов позволят создать элементы-идентификаторы, которые исключат возможность наложения на форму неверного гибкого описания, что сократит время обработки форм и повысит ее качество. Затем можно переходить к созданию остальных элементов.

Вопрос о порядке создания элементов и блоков решается только пользователем. Мы рекомендуем после создания каждого элемента или блока наложить гибкое описание и убедиться в том, что элемент позволяет найти нужный объект на всех тестовых изображениях.

Обычно бывает удобно визуально разделить форму на некоторые логические части и последовательно описать объекты изображения каждой из них. Это облегчит дальнейшую отладку гибкого описания.

Подробнее...

Компиляция гибкого описания

В ходе компиляции гибкого описания выполняется проверка созданного описания (блоков и элементов и их свойств). Компиляция позволяет выявить ошибки и противоречия гибкого описания.

Подробнее...

Наложение и отладка гибкого описания

Проверка гибкого описания выполняется путем наложения гибкого описания на изображение, при этом важен не только сам факт успешного наложения, но и правильность нахождения объектов изображения. Такую проверку следует выполнять после создания каждого элемента и блока. Поиск ошибок в готовом описании, особенно если описываемый документ имеет сложную структуру и множество полей, представляет собой сложную и трудоемкую задачу.

Подробнее...

Экспорт

Готовое гибкое описание экспортируется из FlexiLayout Studio и импортируется в систему потокового ввода форм.

Подробнее...

10.11.2020 12:08:08


Please leave your feedback about this article