Russian (Русский) - Change language

Глоссарий

А

ABBYY FlexiLayout™ Studio

Программа, позволяющая создать описание структуры документа произвольного формата, необходимое для его дальнейшего автоматического распознавания.

D

dot

dot, также dt - сокращение от "document unit", 1/300 дюйма. Единица измерения расстояний на изображении, не зависящая от разрешения. Для изображения с разрешением в 300 dpi расстояние в 1 dot равно 1 точке (пикселю). Не путать с англ. "dot" - "точка".

Замечание. В программе FlexiLayout Studio можно выбрать единицу измерения расстояний для всех параметров поиска элементов, задаваемых диалогами свойств. См. Единицы измерения объектов. При задании параметров поиска с помощью языка FlexiLayout (вкладка Advanced свойств элементов) также можно использовать другие единицы измерения расстояний - cm, mm, inch, pt (подробнее см. Cистема координат и единицы измерения). Все эти единицы измерения также не зависят от разрешения изображения, что позволяет накладывать одно и то же гибкое описание на изображения документов, отсканированные с различным разрешением.

Б

Блок

Указание области изображения, из которой необходимо извлечь данные.

В

Вариант гибкого описания

Набор элементов, описывающий одну из разновидностей документа.

Г

Гибкое описание

Формализованное описание структуры документа, нацеленное на поиск местоположения полей. Файл формата AFL.

Гипотеза

Предположение, что найденный объект(ы) изображения соответствует элементу, т.е. удовлетворяет заданным свойствам и условиям поиска данного элемента.

К

Класс документа

Группа документов, обладающих общими признаками. Пример: паспорт, инвойс, договор об аренде.

Классификатор

Настраиваемый проект FlexiCapture или FlexiLayout Studio, предназначенный для применения технологии классификации к пакетам документов..

Классификация

Технология ABBYY FlexiCapture, позволяющая классифицировать документы по типам и разновидностям без создания гибких описаний.

Компиляция гибкого описания

Проверка корректности созданного описания: свойств блоков и элементов, условий поиска и т.д.

М

Многостраничное полотно

Множество всех страниц документа называется многостраничным полотном. Многостраничное полотно образуется при склеивании страниц документа сверху вниз, без стыков и зазоров, левые границы всех страниц лежат на одной прямой. Порядок склейки страниц определяется порядком страниц в пакете.

На многостраничном полотне используются две системы координат – глобальная (сквозная) и локальная (координаты на некоторой странице). Глобальная система отличается от локальных одностраничных координат только параллельными переносами (сдвигами), причём сдвиг свой для каждой страницы.

Н

Наложение гибкого описания

Процесс поиска на изображении объектов, соответствующих элементам, и разметки блоков.

Недопустимый элемент

Элементы данного типа не могут присутствовать на изображении. Цепочка гипотез, содержащая данный элемент, отбрасывается.

Необязательный элемент

Элементы данного типа могут отсутствовать на изображении. Если необязательный элемент не был найден, то наложение гибкого описания не прекращается, и формируется нулевая гипотеза с качеством, заданным при описании элемента.

Нулевая гипотеза

Гипотеза, формируемая в случае, если в области поиска не найден ни один объект соответствующий необязательному элементу. Качество нулевой гипотезы задается пользователем при описании элемента.

О

Область поиска

Условие поиска, позволяющее определить ту часть изображения, в которой надо искать объекты изображения, соответствующие данному элементу.

Обязательный элемент

Элементы данного типа не могут отсутствовать на изображении. Если обязательный элемент не был найден, то наложение гибкого описания прекращается.

Опорный элемент

Элемент, использующийся для поиска других элементов и для разметки блоков.

П

Предраспознавание

Процесс анализа изображения, выделение и классификация по типам элементарных объектов изображения.

Профиль классификации

Режим обучения классификатора. Обучить классификатор возможно на основе изображения или текста документа. Подробнее см. Профили классификации

Р

Регион

Неразрывная область изображения, состоящая в общем случае из нескольких прямоугольников, расположенных так, что низ одного соприкасается с верхом другого.

Ф

Форма

Документ, состоящий из одной или нескольких страниц и предназначенный для заполнения человеком от руки или любым печатным способом. Для удобства заполнения и обработки на форме размечаются поля для ввода данных, рядом с полями располагаются поясняющие заголовки.

Э

Элемент

Описание одного или нескольких объектов изображения (разделитель, статический текст, картинка, и т.д.), позволяющее задать условия поиска объекта(ов) в заданной области изображения. Элемент содержит информацию о том, что за объект нужно искать на изображении, каковы его свойства, область поиска и отношения с другими элементами.

Эталонная разметка

Разметка блоков на изображении, созданная вручную или на основе результатов наложения гибкого описания.

12/1/2020 7:04:05 AM


Please leave your feedback about this article