Russian (Русский) - Change language

Paragraph

Paragraph - элемент, представляющий собой описание абзаца. При поиске рассматриваются все текстовые объекты, пересекающие область поиска.

В дереве элементов элемент типа Paragraph отображается значком .

Данный элемент предназначен для поиска абзацев неизвестного содержания. При этом рассматриваются объекты Recognized Words и Recognized Lines, найденные при предраспознавании изображений и находящиеся в области поиска элемента.

Свойства элемента Paragraph, задающие параметры искомого объекта

Свойства, определяющие параметры искомого объекта, задаются в диалоге свойств элемента на вкладке Paragraph. Для того чтобы открыть диалог свойств элемента, щелкните правой кнопкой мыши по элементу в окне FlexiLayout и выберите в контекстном меню команду Properties....

Показать диалог Properties, вкладка Character String

  • Min line count - минимальное количество строк в абзаце. Задается нечетким интервалом.
  • Max line count - максимальное количество строк в абзаце. Задается нечетким интервалом.
  • Alignment - тип выравнивания.
  • Max disalignment - максимальное отклонение выравнивания. Указывается в используемых единицах измерения объектов.
  • Allow first line indent - значение отступа в начале абзаца. Указывается в используемых единицах измерения объектов.
  • Allow "hanging" line - включать ли "висячую" строку в абзац.
  • Max space in line - максимально допустимая абсолютная длина пробела внутри найденного объекта. Значение данного свойства указывается в используемых единицах измерения объектов. При поиске текста символы добавляются в цепочку до тех пор, пока расстояние между соседними символами не превышает значения Max space in line.
  • Max interline space - максимальное расстояние между строками. Указывается в используемых единицах измерения.
  • Max relative interline space - максимальное расстояние между двумя строками по отношению к высоте верхней строки. Если расстояние между строками превышает данное значение, вторая строка не попадает в гипотезу.
  • Min line height - минимальная высота строки (размер шрифта). Задается нечетким интервалом.
  • Max line height - максимальная высота строки. Задается нечетким интервалом.
  • Min line width - минимальная ширина строки. Задается нечетким интервалом.
  • Max line width - максимальная ширина строки. Задается нечетким интервалом.
  • Whole words only - определяет, нужно ли включать в гипотезу части слов, которые пересекают границу области поиска. Чтобы не включать в гипотезу обрывки слов, необходимо отметить данную опцию.
  • Remove stamp. Одной из возможных проблем при распознавании текста платежных документов является поставленная сверху на текст печать. Обычно она располагается в правой нижней части текста. Результатом распознавания закрытой печатью области изображения будет большое количество бессмысленных обрывков фраз, т.к. текст на таких участках изображения практически не читается.
    Во избежание таких трудностей целесообразно часть текста, закрытую печатью, не включать в блок, а текст, не попавший в блок ввести с изображения вручную (при этом не придется предварительно удалять неверно распознанный текст).
    Если свойство Remove stamp выбрано, то при поиске программа проанализирует правый нижний угол области поиска. При обнаружении обрывков текстовых объектов, которые могут свидетельствовать о наличии печати, программа удалит их.
  • Ignore separators - игнорирование сепараторов при поиске абзаца. Если абзацы должны ограничиваться сепараторами, отключите данную опцию.

См. также:

Создание, копирование и удаление элементов

Обзор свойств элементов гибкого описания FlexiLayout

Область поиска элемента

Дополнительные условия поиска элемента Paragraph

01.12.2020 7:04:05


Please leave your feedback about this article