Russian (Русский) - Change language

Формирование и оценка гипотез для элемента Static Text

При поиске статического текста на изображении допускается неточное совпадение результата распознавания текстового объекта и заданного значения текста элемента.

Например, можно задать свойства элемента Static text таким образом, что при поиске статического текста «Поставщик» будут рассматриваться в качестве гипотез объекты изображения вида «Поставщик», «Ростовщик» и т.п.

В свойствах элемента задаются значения свойств:

  • Max error percentage - относительное максимально допустимое число ошибок в слове в процентах, т.е. отношение числа ошибок в тексте гипотезы к числу букв в тексте гипотезы.
  • Max number of errors - абсолютное максимально допустимое число ошибок в слове (каждый неверный символ или его отсутствие считается ошибкой).

Если число ошибок превысит значение, указанное в свойстве, то найденный объект не будет рассматриваться в качестве гипотезы. Если же созданная гипотеза содержит допустимое число ошибок, то ее качество будет тем ниже, чем больше в ней ошибок.

Поскольку заранее не известно, из скольких букв будет состоять найденный объект (это зависит от изображения), а также из-за того, что элемент допускает задание нескольких вариантов текста для поиска (разной длины), то в каждом случае формирования гипотезы отсекающим будет являться либо абсолютный (Max number of errors), либо относительный (Max error percentage) параметр. В процессе формирования и оценки гипотезы используется условие, оказывающееся более строгим, т.е. если найденный объект будет удовлетворять одному параметру, но не удовлетворять другому, то объект не будет рассматриваться в качестве гипотезы.

Сформированная гипотеза элемента Static text имеет следующие свойства:

Свойство Описание
Element name Указывается полное имя элемента.
Page Указывается номер страницы, на которой был найден элемент.
Surrounding rect Указываются координаты описывающего прямоугольника, содержащего регион гипотезы.
Width Ширина региона гипотезы.
Height Высота региона гипотезы.
Keyword Указываются слова, вошедшие в гипотезу. Для каждого слова указывается количество ошибок.
Detected Указывается, был ли найден объект изображения, соответствующий элементу (True), или сформирована нулевая гипотеза (False).
From the best path Указывается, принадлежит ли найденная гипотеза к лучшему пути в дереве гипотез (True) или нет (False).
Pre-search quality Указывается качество гипотезы, с которым она удовлетворяет свойствам элемента, заданным явно или с помощью Advanced pre-search relations.
Post-search quality Указывается качество гипотезы, с которым она удовлетворяет условиям, заданным с помощью Advanced post-search relations.
Chain quality Указывается текущее качество участка цепочки поиска от первого подэлемента текущей группы до данного включительно. Качество цепочки вычисляется перемножением качеств всех подэлементов цепочки. Chain qualityпозволяет сравнивать конкурирующие цепочки между собой.

Подробнее:

Свойства элемента Static Text, задающие параметры искомого объекта

Область поиска элемента

Дополнительные условия поиска

12/1/2020 7:04:05 AM


Please leave your feedback about this article