Russian (Русский) - Change language

Глоссарий

A-Z

ABBYY FlexiCapture

Программное решение для потокового ввода данных с документов различного типа - структурированных (жестких форм), частично структурированных (гибких форм и документов) и неструктурированных (документов в свободном стиле).

ABBYY FlexiLayout Studio

Программа, позволяющая создать описание структуры документа произвольного формата, необходимое для его дальнейшего автоматического распознавания.

ABBYY FormDesigner

Программа ABBYY FormDesigner предназначена для создания макетов машиночитаемых форм, которые после тиражирования и заполнения планируется обрабатывать с помощью системы автоматизированного ввода форм ABBYY FlexiCapture. Разработка макета формы является важным этапом, так как от "правильности" разработанного макета (его машиночитаемости) зависит эффективность всех последующих этапов обработки: сканирования, распознавания, проверки и экспорта.

ABBYY FlexiCapture for Invoices

Компонента ABBYY FlexiCapture, предназначенная для ввода инвойсов.

ADF

Automatic Document Feeder. Устройство для автоматической подачи бумаги, позволяющее отсканировать большое количество документов без дополнительного вмешательства оператора.

dpi

Dots per Inch. Количество точек на дюйм; единица измерения разрешения.

FlexiLayout

Описание структуры гибкого документа. Это описание разрабатывается в программе ABBYY FlexiLayout Studio и передается в ABBYY FlexiCapture. FlexiLayout – своего рода «инструкция» о том, как следует искать и идентифицировать поля на гибкой форме.

F-мера классификации

Метрика, которая используется для совокупного учета точности и полноты классификации. Эта метрика отображается в виде числа (его значение больше 0, но меньше или равно 1) или в процентах.

F-мера для категории вычисляется по формуле:  (β^2 + 1) * Т * П / (β^2 * Т + П), где Т- точность для категории, П-полнота для категории, β - отношение между полнотой и точностью, выбранное для данной модели. Максимальное значение = 1 (100%), при Т = П = 1 (100%).

F-мера для тестового/обучающего множества вычисляется по формуле:  (β^2 + 1) * Т * П / (β^2 * Т + П), где Т- точность для тестового/обучающего множества, П-полнота для тестового/обучающего множества, β - отношение между полнотой и точностью, выбранное для данной модели.

ICR

Intelligent Character Recognition. Так называют технологии или системы, предназначенные для массовой обработки документов, заполненных печатными буквами и цифрами от руки, то есть для распознавания рукопечатных символов.

MRC, Mixed Raster Content

Метод сжатия изображений, содержащих как текстовые, так и растровые компоненты. Производит сегментацию изображения и подбирает для каждого компонента оптимальный алгоритм сжатия, повышая степень сжатия и качество отображаемого изображения.

NER (Named-Entity Recognition, распознавание именованных сущностей)

Задача извлечения информации, основанная на поиске сущностей в неструктурированном тексте и их классификации по определенным категориям.

NLP (Natural Language Processing, обработка естественного языка)

Общее направление искусственного интеллекта и математической лингвистики. Изучает проблемы компьютерного анализа и синтеза естественных языков. Одним из примеров практического применения является извлечение значимой информации из текстов. Включает в себя: машинный перевод, чат-боты, классификацию, анализ тональности, извлечение данных и т. д.

NLP-модель

Механизм, определяющий, какие сущности и сегменты будут извлечены из текста документа и каким образом. Предметная область текста и алгоритм извлечения определяются при обучении модели.

OCR, Optical Character Recognition

Оптическое распознавание типографских текстов.

OMR, Optical Mark Recognition

Оптическое распознавание меток. Так называется технология, позволяющая ABBYY FlexiCapture не только уверенно распознавать на формах обычные метки (галочки, крестики, и т.п.), но и правильно идентифицировать метки, отмеченные по ошибке и затем полностью закрашенные.

SLA (service level agreement)

Соглашение, регламентирующее условия предоставления IT-услуг. В рамках FlexiCapture 12 представляет собой соглашение о времени обработки пакета.

XFD

XML Form Definition (*.xfd) – специальный формат файла формы, созданной в программе ABBYY FormDesigner. Файл формата XML Form Definition используется для создания определения документа в программе ABBYY FlexiCapture.

А

Автообучение

Способность системы автоматически обучаться нахождению полей и идентификации типов документов.

Администратор

Пользователь программы ABBYY FlexiCapture, в обязанности которого входит настройка программы для ввода документов: создание и редактирование определений документов, профилей импорта.

Алфавит

Набор символов, используемых в описываемом языке.

Б

Буквы в гребенке

Тип разметки текста, при которой ограничителем текста является гребенка.

Показать

Буквы в изолированных рамках

Тип разметки текста, при которой ограничителем каждого символа является рамка; рамки изолированы друг от друга.

Показать…

Буквы в рамках

Тип разметки текста, при которой ограничителем каждого символа является рамка; рамки не изолированы друг от друга.

Показать…

В

Верификация

Проверка корректности распознавания, сборки страниц в документы (для многостраничных документов) и выполнения правил.Верификация осуществляется на Станции Верификации Данных (проверка корректности распознавания) и на Станции Верификации (все проверки). Верификация осуществляется в рамках заданий.

Г

Гибкое описание

Формализованное описание структуры документа, нацеленное на поиск местоположения полей. Создается в ABBYY FlexiLayout Studio. Файл формата AFL.

Гибкое определение

Определение документа или раздела, разработанное для обработки гибких документов. Создается путем подключения гибкого описания. Поля таких документов не имеют фиксированного местоположения, их поиск производится с помощью гибкого описания.

Горячая папка

Каталог на жестком диске локального или удаленного компьютера, используемый для импорта изображений. Как правило используется для многократной периодической загрузки изображений без участия пользователя.

Группа меток

Элемент машиночитаемой формы, объединяющий несколько меток, находящихся вблизи друг от друга. В Группе меток может выбираться одна или несколько меток.

Группа полей

Объединение связанных по смыслу полей. Например, группа полей "Компания" включает в себя поля "Адрес", "Имя" и "Налоговый номер".

Групповая верификация

Режим верификации, при котором одинаково распознанные символы поступают на верификацию группой.

Подробнее…

Д

Данные из документа

Данные, полученные в результате обработки (распознавания, проверки и редактирования результатов распознавания) изображений страниц документа.

Документ

Совокупность одного или нескольких изображений страниц и извлеченной из них информации.

Ж

Жесткая форма

Документ, имеющий заданные информационные поля, оформление, количество и местоположение которых строго определены и не меняются от одного экземпляра документа к другому.

Жесткое описание

Определение документа или раздела документа, разработанное для обработки жестких форм. Поля жесткого описания имеют фиксированное расположение.

З

Задание

Набор документов из одного пакета, обрабатывающихся совместно. В зависимости от настроек проекта и этапа обработки может содержать различное количество документов. Если этап обработки предполагает обработку пакета целиком, то в задание входит весь пакет. При автоматическом формировании заданий на верификацию в них попадает по 10 документов (если в пакете менее 10 неверифицированных документов, то они все обрабатываются в одном задании).

Запрещенный символ

Символ, который заведомо не может встретиться в определяемом типе данных.

Подробнее…

И

Игнорируемый символ

Символ, встречающийся внутри слов (например, маркер (bullet)) или символ мягкого переноса (табуляции и т.д.), наличие которого не мешает слову принадлежать к определяемому типу данных.

Подробнее…

Идентификатор

Статический элемент, который используется для однозначного выбора определения среди нескольких с одинаковым расположением реперов. В свойствах таких статических элементов должна быть отмечена опция Использовать для идентификации определения документа.

Идентификация документов

Отнесение документа к одному из предопределенных типов документов.

Идентификация определений документов

Процесс выбора нужного определения документа с помощью идентификаторов.

Изображение

Электронный образ страницы бумажного документа, полученный в результате сканирования.

Инвертированное изображение

Изображение, текст которого напечатан на темном фоне светлыми буквами.

Инвойс

Документ, предоставляемый продавцом покупателю и содержащий перечень товаров, их количество и цену, по которой они будут поставлены покупателю. Для обработки инвойсов в ABBYY FlexiCapture используется отдельное решение — ABBYY FlexiCapture for Invoices.

Индексное поле

Поле, по значению которого производится индексация документов для сортировки и поиска.

Импорт изображений

Добавление в пакет изображений для обработки. Импорт может производиться путем добавления изображений из файлов, путем сканирования или с использованием профилей импорта.

Исправленная метка

Метка, отмеченная по ошибке, и с целью исправления полностью заштрихованная. В случае если у поля метки включена опция Допускать исправления, то программа распознает заштрихованную метку как незаполненную.

К

Картинка

Элемент машиночитаемой формы, не подлежащий распознаванию и предназначенный для экспорта в виде графического объекта (например, файла).

Класс документа

Группа документов, обладающих общими признаками. Пример: паспорт, инвойс, договор об аренде.

Классификатор

Настраиваемый проект FlexiCapture или FlexiLayout Studio, предназначенный для применения технологии классификации к пакетам документов..

Классификация

Технология ABBYY FlexiCapture, позволяющая классифицировать документы по типам и разновидностям без создания гибких описаний.

Ключевое поле

Поле, позволяющее автоматически проверить сборку страниц в документы. Значения ключевых полей должны совпадать на всех страницах одного документа.

Кодовая страница

Таблица, сопоставляющая каждому значению байта некоторый символ (или его отсутствие).

Комплект документов

Набор нескольких документов, сильно связанных по смыслу и служащих какой-то конкретной цели. Для начала какого-нибудь бизнес-процесса от инициатора (заинтересованного лица) требуется собрать и предоставить комплект документов. Комплекты такого рода обычно состоят из формы-заявления и списка обязательных и необязательных сопроводительных документов, причем состав сопроводительных документов и их обязательность регулируются сложными правилами в зависимости от данных, указанных в заявлении.

Контекстная верификация

Режим верификации, при котором распознанные символы поступают на верификацию в контексте поля.

Подробнее…

Контрастность

Соотношение яркости самой темной и самой светлой области изображения.

М

Машиночитаемая форма

Форма, специально изготовленная для целей автоматического ввода, которая содержит служебные элементы (реперы, штрих-коды, линии и т.д.), необходимые для ее успешной обработки.

Метка

Элемент машиночитаемой формы, в который при заполнении вносится отметка (галочка, крест, точка, сплошная закраска и т.д.).

Многостраничный документ

Документ, состоящий из нескольких страниц.

Множество допустимых символов

Набор символов, встречающихся в определяемом типе данных.

Подробнее…

Моноширинный текст

Тип разметки текста, при котором под каждую букву слова отводится одинаковая по высоте и ширине рамка, но границы рамки при сканировании исчезают.

Мощность обработки

Количество страниц, документов или пакетов, обработанных за период времени.

Мультитенантность

Возможность использования одного комплекса ABBYY FlexiCapture несколькими независимыми пользователями, при этом комплекс обеспечивает полную изоляцию данных каждого пользователя друг от друга и разделение ресурсов комплекса между всеми тенантами.

Н

Набор данных

Данные, использующиеся для автоматических проверок документа. Данные могут храниться в таблице внутри ABBYY FlexiCapture и синхронизироваться по расписанию или постоянно извлекаться из внешнего источника.

Наложение изображения

Совмещение отсканированного изображения заполненной формы с изображением бланка в Редакторе определения документа.

Наложение определения документа

Процесс подбора определения документа и наложение полей определения на изображение.

Нераспознаваемый регион

Область изображения, исключенная из распознавания. Нераспознаваемый регион нужен для исключения области с пояснительным текстом или рисунком, мешающим распознаванию поля.

Неструктурированный документ

Документ, содержащий информацию, изложенную в свободном стиле. Например, контракты, письма, приказы, графики являются неструктурированными документами.

Неуверенно распознанный символ

Статус, присваиваемый символу автоматически в процессе распознавания, если он был распознан со значительной долей неуверенности.

О

Область поля

Область изображения, выделенная в определении документа и предназначенная для извлечения информации.

Обучение [определения документа]

Возможность системы использовать введенные данные для анализа и обучаться на основе этих данных, в результате чего происходит улучшение поиска обученных полей на изображениях. Обучение возможно как при предварительной настройке системы, так и в процессе ввода данных.

Обучение поиску полей

Технология ABBYY FlexiCapture, позволяющая идентифицировать поле на основе его окружения.

Ограничитель текстовых полей

Графический элемент, ограничивающий текстовое поле: рамка, гребенка, линия.

Оператор

Пользователь программы ABBYY FlexiCapture, в обязанности которого входит ввод документов: добавление изображений, распознавание, верификация, экспорт распознанных данных.

Определение документа

определение документа определяет принципы, по которым будет происходить идентификация и обработка документов данного типа, и содержит:

  • Структуру документа, т.е. описание допустимой последовательности страниц, которая образует документ данного типа. Структура документа задает правило сборки документа.
  • Описания разделов документа.
  • Список правил, которым должны удовлетворять данные полей.
  • Расположение полей и подписей к ним в окне "Данные" (вид формы данных).
  • Настройки экспорта для документов данного типа.
  • Настройки процесса обработки документов данного типа.

Описание раздела документа

Составная часть определения документа. Соответствует одной или нескольким страницам, содержащим логически завершенный набор полей. Поля внутри одного раздела могут переходить с одной страницы на другую (например, многостраничные таблицы), а наборы полей разных разделов не пересекаются.

Описание раздела может быть гибким, либо жестким.

Ориентация страницы

Расположение страницы относительно правильного расположения: сверху вниз, слева направо. Ориентация страницы может быть автоматически определена при распознавании изображения страницы; с этой целью в программе ABBYY FlexiCapture предусмотрено задание возможной ориентации.

Ориентация текста

Направление текста в поле относительно расположения страницы.

Очередь

Документы, объединенные в задания и/ или пакеты, ожидающие обработки на определенном этапе.

См. Этапы обработки и очереди.

Очистка изображения

Удаление с изображения отдельных мелких черных точек. Лишние точки могут появиться в процессе сканирования и для качественного распознавания данных их лучше удалить. Также при очистке изображения происходит удаление точек фона или ограничительных линий с растровых форм.

Ошибка / предупреждение

Ошибка / предупреждение возникает, если распознанное значение поля (или нескольких полей) не удовлетворяет автоматически проверяемым условиям или не соответствует указанному формату. Ошибки / предупреждения бывают:

  • однополевыми - ошибки / предупреждения правил и формата, настроенные на одно поле;
  • многополевыми - ошибки / предупреждения правил, в которых участвует несколько полей.

Ошибка сборки

Данная ошибка возникает, если получившийся в результате автоматического разбиения документ включает страницы из других документов, страницы документа идут в неправильной последовательности или на разных страницах документа не совпадают значения ключевых полей.

П

Пакет документов

Совокупность документов, сгруппированная пользователем. Обычно пакет соответствует пачке документов, отсканированных за один раз, или импортированных из определенного каталога.

Пакеты обучения

Пакеты документов, предназначенные для обучения и тестирования определений документов на разновидности документов. В результате обучения получается разновидность гибкого описания. См. Пакет документов, Разновидность документа, Разновидность гибкого описания.

Переменная окружения

Строка, использующаяся для хранения текстовой информации, например, о настройках системы. Например, с помощью переменных окружения можно в компактной форме задать строку соединения с базой данных либо переменную, которая будет использоваться при указании имени файла экспорта.

Поворот изображения

Поворот изображения вокруг его центра.

Проверка позиций инвойса

Возможность системы подтверждать при верификации инвойс на основе заказа (контракта) на поставку.

Профиль классификации

Режим обучения классификатора. Обучить классификатор возможно на основе изображения или текста документа. Подробнее см. Профили классификации

Подстановка из базы данных

Проверка распознанных данных поля на соответствие значениям из базы данных.

Поле

Элемент документа, предназначенный для извлечения данных. Поля могут быть простыми или составными, как, например, поле типа «таблица», где каждая ячейка также может рассматриваться как отдельное «дочернее» поле таблицы.

Поле без разметки

Поле, определенное в определении документа, но не имеющее области на изображении.

Поле Группа Меток

Поле определения документа, содержащее группу меток.

Поле для ручного ввода

Поле определения документа, содержащее нераспознаваемый текст (например, состоящий из слитных букв), который необходимо ввести с клавиатуры.

Поле Картинка

Поле определения документа, содержащее картинку.

Поле Метка

Поле определения документа, содержащее метку.

Поле с несколькими областями

Поле, состоящее из нескольких областей на изображении. Области такого поля могут располагаться на расстоянии друг от друга, даже на разных страницах. Значения из всех областей одного поля объединяются и экспортируются вместе, как одно поле. Обычно используется для объектов, расположенных на нескольких страницах, например, для больших таблиц.

Поле с несколькими экземплярами

Поле, используемое для описания нескольких объектов одинакового типа (повторяющихся объектов). По сути, эти объекты являются одним и тем же полем, и обладают общими свойствами, но их несколько. Для того чтобы не создавать несколько одинаковых полей, используются поля с несколькими экземплярами. Поля с несколькими экземплярами экспортируются в отдельные файлы или таблицы базы данных.

Поле Таблица

Поле определения документа, содержащее таблицу. Это составное поле, каждый столбец таблицы представляет собой набор полей одного типа: текст, метки, штрих-коды или картинки.

Поле Штрих-код

Поле определения документа, содержащее штрих-код, предназначенный для распознавания.

Полнота

Характеристика, которая позволяет оценить качество автоматической классификации. Рассчитывается как отношение верно отнесенных к классу А документов к объединению верно и неверно отнесенных к классу А документов.

Полуструктурированный документ

Документ, содержащий набор информационных полей, оформление, количество и расположение которых может значительно отличаться в разных экземплярах документа.

См. Типы документов, обрабатываемых с помощью программы ABBYY FlexiCapture.

Пользовательский словарь

Вспомогательный словарь, составленный пользователем и содержащий список слов, которые не входят во встроенный словарь программы. Пользовательский словарь подключается к предустановленным словарям с целью улучшения качества распознавания документов за счет добавления в словарь специализированных терминов, аббревиатур, названий компаний и т. д.

Пользовательский тип данных

Тип данных, созданный пользователем.

Поставщик

Юридическое или физическое лицо, поставляющее товары или услуги. За оказанные услуги или поставленные товары в дальнейшем поставщик выставляет инвойс, который можно распознать с помощью ABBYY FlexiCapture for Invoices.

Поставщик удостоверений

Система или сервис, решающая задачи управления пользователями и аутентификации пользователей, например, Azure AD, OneLogin, Okta

Потоковый ввод данных

Автоматизированное извлечение данных из аналоговых (печатных) и цифровых (отсканированных изображений в файлах) документов.

Потоковый ввод документов

Автоматизированный перевод бумажных документов в электронный вид.

Пояснительный текст

Элемент машиночитаемой формы, представляющий собой описательный текст (название формы, названия полей, пояснения к полям и т.д.)

Правила

Некоторые условия, накладываемые на данные в полях и автоматически проверяемые программой.

Предраспознавание

Полнотекстовое распознавание изображений документа для последующего наложения полей определения документа.

Приложение

Страницы, не содержащие полей, но участвующие в сборке документа. Из этих страниц не извлекаются данные, но они могут быть сохранены в виде изображения или в формате PDF с возможностью поиска.

Проверка правил

Автоматическая проверка распознанных данных на соответствие заданным правилам.

Проект

Проект – это единая среда, объединяющая пакеты документов и настройки, необходимые для их обработки, такие как определения документов, профили импорта и другие.

Простой текст

Тип разметки текста, при котором текст вписывается в блок без каких-либо ограничителей.

Профиль импорта

Совокупность настроек, используемых для добавления в пакет изображений: источник импорта, опции обработки изображений, опции очистки горячей папки и др.

Профиль экспорта

Совокупность настроек, определяющих способ передачи обработанных данных: формат выходных файлов, каталог хранения, условия выполнения экспорта и др.

Публикация определения документа

Предоставление доступа к новой версии определения документа после редактирования. Опубликованная версия участвует в обработке документов из рабочих пакетов, в то время как неопубликованная, локальная версия, может участвовать только в обработке документов из тестовых пакетов.

Р

Рабочие пакеты

Пакеты документов, предназначенные для ввода данных. Для обработки рабочих пакетов используются только опубликованные определения документов.

Раздел

Логически обособленная часть документа, которая содержит набор извлекаемых полей и используется при распознавании (в частности, при сборке страниц в документы). Раздел может быть одно- или многостраничным, жёстким или гибким.

Разделитель

Элемент машиночитаемой формы, представляющий собой вертикальную или горизонтальную линию.

Разметка [страницы]

Расположение регионов полей на изображении документа. Разметка может быть определена автоматически или задана пользователем вручную.

Разметка текста

Способ оформления области страницы, предназначенной для ввода текста.

Разновидность гибкого описания

Гибкое описание для разновидности документов, созданное в результате обучения на данной разновидности документов или специально разработанное для данной разновидности документов.

Применяется дополнительно к общему гибкому описанию.

Разновидность документа

Группа документов внутри одного типа, обладающая общими признаками.

Например, инвойсы разных поставщиков или банковские выписки, выпущенные одним банком.

Разрешение

Параметр изображения. Измеряется количеством точек, приходящихся на дюйм изображения.

Распознавание

Нахождение соответствия элементов изображения определенным символам.

Распознавание меток (OMR)

Определение наличия отметки в поле метки на форме.

Распознавание текста (OCR, ICR)

Перевод графического изображения в текстовый вид.

Распознавание штрих-кода

Перевод графического изображения штрих-кода в числовой или текстовый вид.

Растровая линия

Линия, состоящая из точек, расположенных на одинаковом расстоянии друг от друга.

Растровая форма

Форма, на которой информационные поля выглядят как белые прямоугольники на сером фоне, состоящем из растровых линий, или как прямоугольники, ограниченные растровыми линиями.

Результирующий класс

Класс, присвоенный документу в результате автоматической классификации.

Репер

Статический элемент, представляющий собой черный квадрат, прямоугольник, крестик или уголок, и предназначенный для наложения определения.

Подробнее…

Реперный текст

Статический элемент, представляющий собой текст, присутствующий на незаполненной форме и не предназначенный для извлечения информации. Это может быть любой пояснительный текст или заголовок. Реперный текст может использоваться для наложения определения документа и для идентификации.

Реперный штрих-код

Статический элемент, представляющий собой штрих-код, не предназначенный для извлечения информации. Реперный штрих-код может использоваться для наложения определения документа и для идентификации.

Роль оператора

Свойство учетной записи пользователя ABBYY FlexiCapture, определяющее доступные пользователю данные и действия с ними.

Рукопечатный текст

Тип распознаваемого текста, представляющий собой текст, написанный от руки раздельными буквами.

С

Сводный раздел

Раздел определения документов, предназначенный для группировки основных полей комплекта документов в одном разделе с целью их проверки на одной форме данных. Это позволит ускорить работу оператора за счёт того, что отдельные документы он будет открывать только в случае ошибок или сомнений в правильности извлеченных данных.

Сегмент

Область документа, состоящая из одного или нескольких абзацев. Используется для сужения области поиска сущностей. Так же может являться полем, которое необходимо извлекать, например, условия прекращения контракта.

Сегментация

Этап, предваряющий извлечение целевой информации в тексте. Позволяет определить расположение значимой информации в объемном тексте с точностью до абзаца. В результате поиск сущностей производится не во всем исходном объеме документа, а только в его части - сегменте.

Серая фоновая форма

Форма, все информационные поля которой выполнены в виде белых прямоугольников на сером фоне, исчезающем при сканировании.

Сканирование

Процесс получения электронного образа страницы бумажной формы с помощью сканера.

Словарь

Список слов, используемый при определении конкретного типа данных.

Подробнее…

Служебное поле

Поле, заполняемое автоматически на основе данных из выбранного источника. Не имеет разметки на изображении документа.

Cправочник

Список в виде текстового файла или ODBC-совместимой базы данных, используемый для хранения справочной информации. Например, возможных значений извлекаемых полей документов или информации, необходимой для извлечения полей документа.

Статические элементы

Нераспознаваемые элементы, служащие для наложения определения документа и идентификации. Такими элементами являются: реперы, реперный текст, разделители, реперные штрих-коды.

Стиль написания

Манера написания, присущая определенной группе людей, например американская манера написания цифр.

Подробнее…

Страница

Изображение страницы бумажного документа и результаты его обработки.

Сущность

Поле или группа полей, содержащая значимую информацию, которую необходимо извлечь из текста при помощи методов NLP. Например, имена людей, названия компаний, местоположение, суммы, даты.

Т

Таблица

Данные, расположенные по двумерной сетке, не обязательно видимой. В программе обрабатываются таблицы, состоящие из столбцов, каждый из которых содержит данные одного типа, и повторяющихся строк.

Текст в рамке

Тип разметки текста, при котором ограничителем текста является рамка.

Показать…

Текст в рамке с гребенкой

Тип разметки текста, при котором ограничителем текста является рамка с нижней границей в виде гребенки.

Показать…

Текст документа

Полученный в ходе предварительного распознавания перед наложением гибкого описания полный текст документа. При необходимости данный текст можно сохранить (требуется дополнительное дисковое пространство), чтобы в дальнейшем использовать во время верификации.

Текст на линии

Тип разметки текста, при котором ограничителем текста является линия снизу.

Показать…

Текстовое поле

Элемент машиночитаемой формы, предназначенный для ввода текста при заполнении формы.

Тенант

Изолированный экземпляр приложения, предназначенный для независимого пользователя.

Тестовые пакеты

Пакеты документов, предназначенные для тестирования и отладки определений документов. Для обработки тестовых пакетов используются локальные копии определений документов.

Тип данных

Признак поля, описывающий известные ограничения на возможное значение поля и используемый при его распознавании для уменьшения числа возможных вариантов распознавания.

Подробнее…

Тип документа

Группа документов, обладающих общими признаками и имеющая самостоятельный смысл с точки зрения бизнес процесса.

Например, инвойсы, контракты, паспорта.

Тип пакета

Свойство пакета, описывающее параметры обработки документов в соответствующих пакетах.

Типографский текст

Тип распознаваемого текста, представляющий собой текст, полученный типографским способом или с помощью лазерного или струйного принтера с разрешением не менее 300 точек на дюйм.

Точность

Характеристика, которая позволяет оценить качество автоматической классификации. Рассчитывается как отношение верно отнесенных к классу А документов к объединению верно и неверно отнесенных к классу А документов.

Ф

Файл описания

Сопроводительный файл, который используется для определения принципа формирования пакета при добавлении изображений из Горячей папки.

Форма

Документ, состоящий из одной или нескольких страниц и предназначенный для заполнения человеком от руки или любым печатным способом.

Ц

Цветная фоновая форма

Форма, все информационные поля которой выполнены в виде белых прямоугольников на цветном фоне, исчезающем при сканировании.

Ч

Черно-белая линейчатая форма

Форма, границы информационных полей которой задаются обычными линиями, не исчезающими при сканировании.

Ш

Штрих-код

Элемент машиночитаемой формы, представляющий собой штриховые знаки, кодирующие цифровую информацию посредством чередующихся полос черного и белого цвета определенной длины. Штрих-код в документе может предназначаться для извлечения информации (поле штрих-код) или для наложения или идентификации определения документа (реперный штрих-код).

Э

Экспорт

Процесс передачи обработанных данных во внешнюю информационную систему или файл.

Элемент управления

Элемент типа текст, поле или кнопка, помещаемый на форму данных.

Эталон текста

Файл, содержащий образцы начертания всех символов алфавита.

Эталонная разметка

Разметка, заданная пользователем вручную (эталон), с которой сравнивается разметка страницы, определенная автоматически. На основании этого сравнения определяется точность автоматического нахождения регионов полей.

Эталонный класс

Класс, который по мнению эксперта присвоен документу в результате ручной классификации. Эталонным классом может быть, как раздел документа, так и его разновидность.

Этап обработки

Стадия процесса обработки, на которой над документом (или пакетом документов в целом) выполняется определенное действие (автоматически или с участием оператора).

См. Этапы обработки и очереди.

Я

Язык распознавания

Язык, на который опирается ABBYY FlexiCapture при распознавании текста.

Язык (регион)

Свойство поля, определяющее язык написания и соответствующие ему наборы региональных параметров (например, способ написания даты или адреса).

Яркость

Порог световой чувствительности, определяющий, начиная с какого значения полутона шкалы градаций серого будут восприниматься сканером как белый цвет.

11/10/2020 12:08:08 PM


Please leave your feedback about this article