Russian (Русский) - Change language

Анализ изображений

Цель предварительного анализа - определить объекты изображения, описание которых можно взять за основу гибкого описания, т.е. эти объекты должны присутствовать на всех изображениях и должны быть одинаковым образом распознаны программой.

Также во время предварительного анализа необходимо правильно определить порядок элементов в гибком описании, т.к. от этого зависит последовательность поиска элементов при наложении гибкого описания.

Проводя предварительный анализ изображений, придерживайтесь следующего сценария:

  1. Просмотрите изображения пакета.
  2. Попробуйте визуально (на “глаз”) определить те объекты изображения, которые есть на большинстве изображений и встречаются на каждом изображении только один раз. Эти объекты можно определить первыми при создании гибкого описания.
  3. Рекомендуется сначала подобрать на изображении объект(ы), который может служить идентификатором документа. Это может быть заголовок или иной объект, четко указывающий на принадлежность документа к данному типу. Объект-идентификатор должен присутствовать на всех формах и распознаваться, по возможности, без ошибок. Элемент, соответствующий идентификатору, рекомендуется сделать обязательным для нахождения. Если же при наложении гибкого описания такой объект не будет найден на форме, процесс наложения гибкого описания будет прерван. При этом можно будет говорить о том, что форма не относится к данному типу документов.
  4. Продумайте последовательность создания элементов и расположение их в дереве элементов. При наложении гибкого описания поиск объектов изображения выполняется в том порядке, в каком идут в дереве гибкого описания элементы, соответствующие искомым объектам.
  5. Продумайте пути нахождения каждого объекта, соответственно этому выбрать свойства элемента. Создание гибкого описания следует начинать с создания наиболее надежных элементов, т.е. элементов, которые есть практически на каждом изображении, причем число вариантов такого элемента на изображении минимально. В дальнейшем описании они будут использоваться как отправные точки для поиска элементов меньшей степени надежности, т.е в качестве опорных элементов.
    Нужно стремиться как можно строже задавать свойства элемента, чтобы найденная гипотеза была возможно более надежной.
    Во избежание резкого разрастания дерева гипотез не рекомендуется увеличивать заданное по умолчанию значение параметра  Number of surviving hypotheses.
  6. Продумайте возможность объединения элементов в группы. Программа позволяет создавать составные элементы - группы элементов любой степени вложенности. Это удобно при отладке независимых частей гибкого описания. Например, все описание из 100 элементов может содержать всего 3 составных элемента первого уровня: заголовок, тело и нижнюю часть. Каждый из этих составных элементов в свою очередь будет содержать составные элементы, предназначенные для поиска небольших фрагментов данной логической части гибкого описания.
    Помимо сокращения перебора вариантов такая структура обеспечивает удобство отладки и редактирования гибкого описания в дальнейшем, т.к. различные части описания будет удобно дополнять и отлаживать независимо друг от друга.

Замечание. Текстовые строки, пересекающие заданную область предраспознавания, распознаются целиком (в том числе части строк, выходящие за пределы области).

11/10/2020 12:08:08 PM


Please leave your feedback about this article