Russian (Русский) - Change language

Гипотезы

Гипотеза - предположение, что найденный объект(ы) изображения соответствует элементу, т.е. удовлетворяет заданным свойствам и условиям поиска данного элемента.

Замечание. В области поиска элемента может находиться несколько объектов, соответствующих данному элементу. В этом случае в области поиска будет сформировано несколько гипотез элемента.

Основной характеристикой гипотезы является Качество гипотезы - оценка, показывающая, насколько хорошо найденный объект соответствует данному элементу (его свойствам и условиям поиска).

Качество гипотезы представляет собой число от 0 до 1. Качество гипотезы для составного элемента вычисляется перемножением качеств гипотез для всех его подэлементов.

Качество гипотезы получается в результате перемножения качеств [ Pre-search quality ] и [ Post-search quality ], где

  • Pre-search quality - качество свойств элемента, заданных в диалоге свойств на вкладке General, вкладке типа элемента, вкладке Search Constraints, вкладке Relations и на вкладке Advanced в разделе Advanced pre-search relations;
  • Post-search quality - является результатом применения условий, заданных на вкладке Advanced в разделе Advanced post-search relations.

Для необязательных элементов при наложении гибкого описания может быть создана так называемая нулевая гипотеза.

Нулевая гипотеза - это предположение о том, в области поиска элемента искомый объект отсутствует. Нулевая гипотеза формируется, если в области поиска не найден ни один объект, соответствующий необязательному элементу и имеющий качество выше, чем качество нулевой гипотезы. Качество нулевой гипотезы задается в диалоге свойств элемента на вкладке General.

Таким образом, если ни один объект, соответствующий необязательному элементу, не был найден, то наложение гибкого описания не прекращается, а формируется нулевая гипотеза и ей присваивается качество, заданное пользователем при описании необязательного элемента.

Далее для краткости изложения под гипотезой мы будем понимать, совокупность объектов изображения, включенных в гипотезу, а также соответствующую ей область на изображении (регион гипотезы).

Пример поиска объекта изображения и выдвижения гипотез

Допустим, нам надо описать два элемента для поиска статического текста. Первый элемент (StaticText1) будет описывать условия поиска статического текста со значением «мама», а второй (StaticText2) - статического текста со значением «папа». Будем считать, что оба элемента не являются обязательными, и качество нулевой гипотезы у обоих имеет значение по умолчанию 0,97.

Не задаем никаких условий, ограничивающих область поиска элемента StaticText1. Но, допустим, мы знаем, что элемент StaticText2 должен находиться ниже элемента StaticText1. Поэтому для элемента StaticText2 зададим соответствующее условие на вкладке Relations свойств элемента (Below: SearchElements.StaticText1;). Зададим значение искомого текста для каждого элемента. Чтобы исключить ошибку, связанную с перепутыванием слов «мама» и «папа» при поиске, но все же допуская, что качество изображения может привести к ошибкам предраспознавания искомых слов, зададим Max number of errors (максимальное абсолютное количество ошибок) для обоих элементов равным 1, т.е. допустима одна ошибка.

Посмотрим, что получится на тестовом изображении, в котором слово «мама» присутствует дважды (выше и ниже слова «папа»), но в слове, расположенном выше присутствует ошибка в одном символе.

После запуска процедуры наложения гибкого описания на данном изображении увидим, что для элемента StaticText1 было сформировано две гипотезы. Одна с качеством 0,98, соответствующая слову с ошибкой (выше слова «папа»). А другая, не содержащая ошибок, но находящаяся ниже слова «папа», получила качество 1.

На данном этапе качество каждой из цепочек совпадает с качеством соответствующих гипотез. Поэтому лучшая цепочка состоит из гипотезы с качеством 1.

Поскольку мы задали в условиях поиска элемента StaticText2 «искать ниже элемента StaticText1 », и у нас сформировались две гипотезы элемента StaticText1, программа пытается найти этот элемент в двух областях поиска. В случае гипотезы элемента StaticText1 с качеством 1, соответствующей слову «мама», расположенному ниже слова «папа», элемент StaticText2 не нашелся, т.е. была сформирована нулевая гипотеза с качеством 0,97. В этом случае итоговое качество Chain quality цепочки, состоящей из двух гипотез, является результатом перемножения их оценок качества 1 и 0,97, т.е. равно 0,97.

В случае гипотезы элемента StaticText1 с качеством 0,98, соответствующей слову «мама», расположенному выше слова «папа», элемент StaticText2 был обнаружен и была сформирована гипотеза с качеством 1. В этом случае итоговое качество Chain quality цепочки, состоящей из двух гипотез, является результатом перемножения их оценок качества 0,98 и 1, т.е. равно 0,98.

В итоге оказалась сформирована единственная гипотеза элемента StaticText2, соответствующая лучшей цепочке.

10.11.2020 12:08:08


Please leave your feedback about this article