Russian (Русский) - Change language

Гипотеза элемента Table

Поиск таблиц и разметка столбцов и строк таблицы выполняется по имеющимся на изображении черным разделителям и белым просветам. Помимо разделителей и просветов для удобства нахождения и разметки таблиц используются заголовочная и итоговая часть таблицы. Обе эти части выполняют вспомогательную функцию: они ограничивают содержательную часть таблицы сверху и снизу, помогая тем самым обнаружить тело таблицы и извлечь из него данные. Заголовочная часть таблицы содержит называния столбцов, по ней выполняется разбивка таблицы на столбцы.

После обнаружения таблицы и выделения ячеек формируются гипотезы всего табличного элемента и отдельных столбцов, строк и ячеек.

Сформированная гипотеза элемента Table имеет следующие свойства:

Свойство Описание
Element name Указывается полное имя элемента.
Page Указывается номер страницы, на которой был найден элемент.
Surrounding rect Указываются координаты описывающего прямоугольника, содержащего регион гипотезы.
Width Ширина региона гипотезы.
Height Высота региона гипотезы.
Header found Указывается, найдена ли заголовочная часть таблицы.
Footer found Указываются, найдена ли итоговая часть таблицы.
Body found Указывается, найдено ли тело таблицы.
Order name Указывается имя фиксированной последовательности столбцов, обнаруженной в таблице.
Detected Указывается, был ли найден объект изображения, соответствующий элементу (True), или сформирована нулевая гипотеза (False).
From the best path Указывается, принадлежит ли найденная гипотеза к лучшему пути в дереве гипотез (True) или нет (False).
Pre-search quality Указывается качество гипотезы, с которым она удовлетворяет свойствам элемента, заданным явно или с помощью Advanced pre-search relations.
Post-search quality Указывается качество гипотезы, с которым она удовлетворяет условиям, заданным с помощью Advanced post-search relations.
Chain quality Указывается текущее качество участка цепочки поиска от первого подэлемента текущей группы до данного включительно. Качество цепочки вычисляется перемножением качеств всех подэлементов цепочки. Chain quality.озволяет сравнивать конкурирующие цепочки между собой.

Сформированная гипотеза заголовочной части таблицы имеет следующие свойства:

Свойство Описание
Element name Указывается полное имя элемента.
Page Указывается номер страницы, на которой был найден элемент.
Surrounding rect Указываются координаты описывающего прямоугольника, содержащего регион гипотезы.
Width Ширина региона гипотезы.
Height Высота региона гипотезы.
Перечень имен столбцов Для каждого столбца указывается, найден ли столбец таблицы.
Detected Указывается, был ли найден объект изображения, соответствующий элементу (True), или сформирована нулевая гипотеза (False).
From the best path Указывается, принадлежит ли найденная гипотеза к лучшему пути в дереве гипотез (True) или нет (False).
Pre-search quality Указывается качество гипотезы, с которым она удовлетворяет свойствам элемента, заданным явно или с помощью Advanced pre-search relations.
Post-search quality Указывается качество гипотезы, с которым она удовлетворяет условиям, заданным с помощью Advanced post-search relations.
Chain quality Указывается текущее качество участка цепочки поиска от первого подэлемента текущей группы до данного включительно. Качество цепочки вычисляется перемножением качеств всех подэлементов цепочки. Chain quality позволяет сравнивать конкурирующие цепочки между собой.

Сформированная гипотеза итоговой части таблицы имеет следующие свойства:

Свойство Описание
Element name Указывается полное имя элемента.
Page Указывается номер страницы, на которой был найден элемент.
Surrounding rect Указываются координаты описывающего прямоугольника, содержащего регион гипотезы.
Width Ширина региона гипотезы.
Height Высота региона гипотезы.
Detected Указывается, был ли найден объект изображения, соответствующий элементу (True), или сформирована нулевая гипотеза (False).
From the best path Указывается, принадлежит ли найденная гипотеза к лучшему пути в дереве гипотез (True) или нет (False).
Pre-search quality Указывается качество гипотезы, с которым она удовлетворяет свойствам элемента, заданным явно или с помощью Advanced pre-search relations.
Post-search quality Указывается качество гипотезы, с которым она удовлетворяет условиям, заданным с помощью Advanced post-search relations.
Chain quality Указывается текущее качество участка цепочки поиска от первого подэлемента текущей группы до данного включительно. Качество цепочки вычисляется перемножением качеств всех подэлементов цепочки. Chain qualityпозволяет сравнивать конкурирующие цепочки между собой.

Сформированная гипотеза тела таблицы имеет следующие свойства:

Свойство Описание
Element name Указывается полное имя элемента.
Page Указывается номер страницы, на которой был найден элемент.
Surrounding rect Указываются координаты описывающего прямоугольника, содержащего регион гипотезы.
Width Ширина региона гипотезы.
Height Высота региона гипотезы.
Order name Указывается имя фиксированной последовательности столбцов, обнаруженной в таблице.
Found columns Перечень имен найденных столбцов.
Number of rows Указывается количество рядов в найденном теле таблицы.
Detected Указывается, был ли найден объект изображения, соответствующий элементу (True), или сформирована нулевая гипотеза (False).
From the best path Указывается, принадлежит ли найденная гипотеза к лучшему пути в дереве гипотез (True) или нет (False).
Pre-search quality Указывается качество гипотезы, с которым она удовлетворяет свойствам элемента, заданным явно или с помощью Advanced pre-search relations.
Post-search quality Указывается качество гипотезы, с которым она удовлетворяет условиям, заданным с помощью Advanced post-search relations.
Chain quality Указывается текущее качество участка цепочки поиска от первого подэлемента текущей группы до данного включительно. Качество цепочки вычисляется перемножением качеств всех подэлементов цепочки. Chain quality.озволяет сравнивать конкурирующие цепочки между собой.

Подробнее:

Работа с таблицами

Область поиска элемента

Дополнительные условия поиска

01.12.2020 7:04:05


Please leave your feedback about this article