- Введение
- Новые возможности программы ABBYY FlexiLayout Studio
- Установка, запуск и удаление программы
- Интерфейс программы ABBYY FlexiLayout Studio
- Проект
- Пакет изображений
- Гибкое описание FlexiLayout
- Многостраничное гибкое описание
- Предраспознавание изображения
-
Элементы
- Создание, копирование и удаление элементов
- Обзор свойств элементов FlexiLayout
- Обязательные и необязательные элементы
-
Свойства элементов, задающие параметры искомого объекта изображения
- Элементы Header и Footer
- Элемент Group (составной элемент)
- Элемент Labeled Field
- Элемент Line of Elements
- Элемент First Found
- Элемент Static Text
- Элемент Character String
- Элемент Paragraph
- Элемент Date
- Элемент Currency
- Элемент Phone
- Элемент Named Entity
- Элемент Separator
- Элемент White Gap
- Элемент Barcode
- Элемент Object Collection
- Элемент Region
- Элемент Table
- Элемент Repeating Group
- Область поиска элемента
- Дополнительные условия поиска
- Единицы измерения объектов
- Нечеткий интервал
- Использование баз данных и текстовых файлов
- Обучение элементов
- Браузер зависимостей элементов
- Блоки
- Работа с таблицами
- Гипотеза, дерево гипотез
- Отладка гибкого описания
- Классификация
- Экспорт
-
Язык описания FlexiLayout
- Основные положения
-
Предопределенные типы
- Void
- Logic
- String
- Int
- Distance
- XCoordinate
- YCoordinate
- Real
- Quality
- Area
- ImageObjectType
- DateFormats
- DayFormatVariants
- MonthFormatVariants
- YearFormatVariants
- XInterval
- YInterval
- DistInterval
- Rect
- FuzzyRect
- RectArray
- Region
- ImageObjectSet
- TextTypes
- BarcodeTypes
- BarcodeOrientations
- RecognitionMode
- Direction
- HorSearchAreaBound
- VertSearchAreaBound
- Hypothesis
- HypothesisInstances
- TableBlock
- TableBlockColumn
- TableBlockColumnArray
- TableHypothesis
- TableHypColumn
- TableColumnType
- CurrencyPositionTypes
- PageInterval
- PageArea
- PageEdge
- Page
- SearchAreaPageSetType
- IntArray
- StringArray
- IntFuzzyInterval
- DistFuzzyInterval
- AreaFuzzyInterval
- TextRotations
- Преобразование типов
- Предопределенные константы
- Предопределенные переменные
- Глобальные функции
- Функции для работы с именованными параметрами
- Функции раздела Advanced Pre-Search Relations
- Функции раздела Advanced Post-Search Relations
- Задание свойств элемента
-
Гипотезы и их свойства
- Гипотеза элемента Object Collection
- Гипотеза элемента Character String
- Гипотеза элемента Static Text
- Гипотеза элемента Paragraph
- Гипотеза элемента Barcode
- Гипотеза элемента Date
- Гипотеза элемента Currency
- Гипотеза элемента Phone
- Гипотеза элемента Table
- Гипотеза столбца таблицы
- Гипотеза элемента Repeating Group
- Гипотеза элемента First Found
- Гипотеза элемента Labeled Field
- Гипотеза элемента Region
- Гипотезы всех типов элементов
- Отладочная печать
-
Советы и рекомендации
- Описание текстовых полей, содержащих буквы в рамках
- Поиск даты в случае хорошего и плохого распознавания
- Задание нескольких вариантов значений статического текста. Поиск статического текста со схожими значениями
- Исключение элементов с помощью Exclude
- Использование составных элементов для улучшения организации гибкого описания и поиска элементов
- Задание значений для поиска однострочных элементов Static Text
- Использование функции RestrictSearchArea для ограничения области поиска
- Поиск однострочных полей фиксированного или произвольного формата при разном качестве распознавания
- Использование функций Nearest и FuzzyQuality для поиска элементов
- Оптимизация поиска составного элемента
- Свойство Optional составного элемента
- Поиск цифровых строк
- Вспомогательный элемент с нулевой гипотезой – как средство упрощения гибкого описания
-
Приложение
- Горячие клавиши
- Свойства объектов изображения
- Поддерживаемые входные форматы
- Типы штрих-кодов
- Список поддерживаемых языков распознавания
- Пользовательские словари
- Алфавит, используемый в регулярных выражениях
- Расширенный язык регулярных выражений
-
Диалоги
- Диалог Options
- Редактор нечеткого интервала
-
Свойства элементов
- Вкладка General
- Static Text
- Separator
- White Gap
- Barcode
- Character String
- Paragraph
- Date
- Object Collection
- Phone
- Currency
- Repeating Group
- Вкладка Columns
- Вкладка Order
- Вкладка Header
- Вкладка Footer
- Вкладка Rows
- Вкладка Label
- Вкладка Field Position
- Вкладка Field
- Вкладка Search Constraints
- Вкладка Relations
- Вкладка Advanced
- Вкладка Advanced for All Instances
- Вкладка Errors
- Лицензионный договор с конечным пользователем
- Патенты
- Как купить программу ABBYY FlexiCapture
- Технологии других компаний
-
Обучение на примерах
-
Пример 1
- Шаг 1: Создание нового проекта
- Шаг 2: Добавление изображений в пакет
- Шаг 3: Настройка свойств гибкого описания
- Шаг 4: Предраспознавание
- Шаг 5: Просмотр изображений и результатов предраспознавания
- Шаг 6: Предварительный анализ
- Шаг 7: Выбор элемента для идентификации формы
- Шаг 8: Проверка обнаружения идентификационного элемента
- Шаг 9: Корректировка свойств идентификационного элемента
- Шаг 10: Элемент, описывающий имя планеты
- Шаг 11: Элемент PlanetNameHeader
- Шаг 12: Элемент PlanetName
- Шаг 13: Проверка нахождения поля, содержащего имя планеты
- Шаг 14: Описание поля Your Planet Name. Блок PlanetName
- Шаг 15: Описание поля Name
- Шаг 16: Описание поля Your spaceship number
- Шаг 17: Описание поля Date you arrived at the Earth
- Шаг 18: Описание поля Your identity number on the party
- Шаг 19: Описание поля Произвольный текст
- Шаг 20: Описание поля Your photo in fancy dress
- Шаг 21: Экспорт гибкого описания
- Шаг 22: Подключение гибкого описания к определению документа в программе ABBYY FlexiCapture
-
Пример 2
- Шаг 1: Создание нового проекта
- Шаг 2: Добавление изображений в пакет
- Шаг 3: Настройка свойств шаблона
- Шаг 4: Предраспознавание
- Шаг 5: Просмотр изображений и результатов предраспознавания
- Шаг 6: Создание идентификационного элемента
- Шаг 7: Проверка нахождения заголовка формы, соответствующего идентификационному элементу
- Шаг 8: Выбор элемента для продолжения настройки
- Шаг 9: Описание поля Receipt #
- Шаг 10: Описание поля Receipt #. Элемент Receipt
- Шаг 11: Описание поля Receipt #. Элемент ReceiptNumber
- Шаг 12: Описание поля Receipt #. Блок ReceiptNumber
- Шаг 13: Описание поля Receipt Name
- Шаг 14: Описание поля Ingredients
- Шаг 15: Описание полей Cooking Time и Cooking Description
- Шаг 16: Создание элемента CookingTimeHeader
- Шаг 17: Создание элемента CookingTime
- Шаг 18: Описание месторасположения блока CookingTime
- Шаг 19: Создание элемента InvertedHeader
- Шаг 20: Описание поля Cooking Description
- Шаг 21: Создание элемента Serves
- Шаг 22: Создание элемента Portions
- Шаг 23: Описание поля Cooking Description
- Шаг 24: Описание месторасположения блока CookingDescription
- Шаг 25: Гибкое описание готово
-
Пример 3
- Шаг 1. Предварительные настройки
- Шаг 2. Просмотр изображений и результатов предраспознавания
- Шаг 3. Блоки
- Шаг 4. Анализ изображений и определение последовательности поиска элементов и групп элементов
- Шаг 5. Поиск заголовка поля Delivery Address, элемент kwDeliveryAddress
- Шаг 6. Поиск заголовка поля Invoice Number, элемент kwInvoiceNumber
- Шаг 7. Поиск заголовка поля Invoice Date, элемент kwInvoiceDate
- Шаг 8. Описание поля Invoice Number, элемент InvoiceNumber
- Шаг 9. Описание поля Invoice Date, элементы grDate, InvoiceDate и InvoiceDateAsString
- Шаг 10. Описание составного элемента grAddress
- Шаг 11. Поиск правой границы поля Delivery Address, элемент wgAddressRight
- Шаг 12. Описание поля Delivery Address, элемент DeliveryAddress
- Шаг 13. Продолжаем анализ изображений
- Шаг 14. Поиск вспомогательного горизонтального сепаратора, элемент hsTableHeaderTop
- Шаг 15. Анализ критериев поиска для заголовков столбцов таблицы. Составной элемент TableHeader
- Шаг 16. Поиск заголовка столбца Quantity, элемент kwQuantity
- Шаг 17. Поиск заголовка столбца UnitPrice, элемент kwUnitPrice
- Шаг 18. Поиск заголовка столбца Total, элемент kwTotal
- Шаг 19. Поиск заголовка столбца Sales, элемент kwSales
- Шаг 20. Описание группы Footer, элемент Footer
- Шаг 21. Описание итоговой части таблицы, элемент kwFooter
- Шаг 22. Описание заголовка полей Total, элемент kwTotal
- Шаг 23. Поиск заголовка поля Country, элемент kwOrigin
- Шаг 24. Описание поля Country, элемент Country
- Шаг 25. Поиск полей TotalQuantity и TotalAmount, элементы TotalQuantity и TotalAmount
- Шаг 26. Поиск табличного элемента, элемент InvoiceTable
- Шаг 27. Экспорт гибкого описания и подключение его к определению документа ABBYY FlexiCapture
-
Пример 4
- Шаг 1. Создание нового проекта
- Шаг 2. Просмотр изображений и результатов предраспознавания
- Шаг 3. Блоки
- Шаг 4. Анализ изображений и определение последовательности поиска
-
Шаг 5. Header документа, описание группы InvoiceHeader
- Шаг 5.1 Поиск заголовка поля Invoice Number, элемент
- Шаг 5.2 Поиск заголовка поля Delivery Address, элемент
- Шаг 5.3 Поиск заголовка поля Invoice Date, элемент kwInvoiceDate
- Шаг 5.4 Описание поля Invoice Number, элемент InvoiceNumber
- Шаг 5.5 Описание поля Invoice Date, элементы grDate, InvoiceDate и InvoiceDateAsString
- Шаг 5.6 Описание поля Delivery Address, элементы grAddress, wgAddressAbove, DeliveryAddress
-
Шаг 6. Footer документа, описание группы InvoiceFooter
- Шаг 6.1 Поиск заголовка столбца Product Total, элемент ExtraTag
- Шаг 6.2 Поиск заголовка столбца Description, элемент AddTag
- Шаг 6.3 Описание итоговой части документа, элемент LongFooter
- Шаг 6.4 Описание итоговой части документа, элемент ShortFooter
- Шаг 6.5 Описание итоговой части документа, элемент TextFragment
-
Шаг 7. Описание заголовков столбцов таблицы, группа TableHeader
- Шаг 7.1 Поиск заголовка столбца Designation, элемент kwDesignation
- Шаг 7.2 Поиск заголовка столбца ExtraQuantity, элемент ExtraQtyTag
- Шаг 7.3 Поиск заголовка столбца Quantity, элемент kwQuantity
- Шаг 7.4 Поиск заголовка столбца UnitPrice, элемент kwUnitPrice
- Шаг 7.5 Поиск заголовка столбца Total, элемент kwTotal
- Шаг 7.6 Поиск заголовка столбца Reference, элемент kwReference
- Шаг 7.7 Поиск заголовка столбца Sales, элемент kwSales
- Шаг 7.8 Поиск заголовка столбца Unit, элемент kwUnit
- Шаг 8. Поиск табличного элемента, элемент InvoiceTable
- Шаг 9. Поиск поля TotalAmount, описание составного элемента SumGroup
- Шаг 10. Поиск поля Company, описание составного элемента CompanyGroup, описание элемента Company
- Шаг 11. Экспорт гибкого описания и подключение его к определению документа FlexiCapture
-
Пример 1
- Техническая поддержка
- Глоссарий
Окно Batch
В окне Batch содержится таблица изображений, выбранных для создания и отладки гибкого описания или классификатора.
В столбцах таблицы для каждой страницы отображаются результаты операций, выполненных с изображением.
Работа с несколькими пакетами
Внимание! Гибкое описание/Классификатор является единым для изображений всех пакетов проекта.
ABBYY FlexiLayout Studio текущей версии поддерживает работу с несколькими пакетами в рамках одного проекта. Данная функциональность позволяет группировать изображения различного вида или из различных источников и работать с ними независимо.
По умолчанию каждый новый проект содержит один пакет. При необходимости пользователь может создать, удалить или отредактировать пакет. При этом в проекте всегда должен быть хотя бы один пакет.
Как создать/отредактировать пакет
Чтобы создать новый или отредактировать существующий пакет, в главном меню выберите пункт Batch → Batches... или нажмите кнопку Batches... в окне Batch. В открывшемся диалоговом окне Batches отображается список существующих пакетов. Для каждого пакета указывается следующая информация:
- Name – название пакета.
- Path – название папки, в которой хранится вся информация о текущем пакете. Полный путь к папке указан в свойствах пакета.
- Comment – комментарий пользователя.
- Total Pages – число страниц в пакете.
- Created – дата и время создания пакета.
- Modified – дата и время последнего изменения пакета.
Свойства пакета
При нажатии кнопки Edit открывается диалоговое окно свойств пакета.
На вкладке General содержится следующая информация:
- Name – название пакета.
- Comment – комментарий пользователя.
- Batch path - полный путь к папке, в которой хранится вся информация о текущем пакете. Доступно копирование пути.
- Pre-recognition - параметры предраспознавания текущего пакета.
Замечание. По умолчанию ко всем пакетам проекта применяются настройки, заданные в свойствах проекта.
На вкладке Input Named Parameters можно просмотреть и отредактировать значение именованных параметров.
Управление пакетами
Переключение между пакетами проекта осуществляется с помощью выпадающего списка в окне Batch или путем выбора необходимого пакета в окне Batch.
В рамках одного проекта возможно перемещение изображений из одного пакета в другой. Чтобы выполнить данную операцию, воспользуйтесь командой Move Pages to Batch... контекстного меню изображения или выберите Move Selected Pages to Another Batch в пункте Batch главного меню.
Описание команд окна пакета при работе с гибкими формами
При нажатии правой кнопкой мыши на заголовке окна пакета Batch отображается контекстное меню, с помощью которого можно автоматически настроить ширину столбцов таблицы, а также скрыть или отобразить какой-либо столбец.
- Fit Column Width – настраивает ширину текущего столбца под максимальный размер его содержимого;
- Fit All Columns Width – настраивает ширину всех столбцов.
Далее в контекстном меню приведен перечень всех доступных свойств страниц пакета.
- Use for Training – используется ли страница при обучении;
- Page No. – номер страницы;
- Analyzed – наложено ли гибкое описание;
- Reference Alternative – эталонный вариант гибкого описания;
- Matched Alternative – наименование варианта гибкого описания, наложенного на страницу;
- Excess Areas – суммарная площадь областей блоков, которые были найдены при наложении, но не вошли в блоки эталонной разметки, выражается в процентах по отношению к суммарной площади блоков эталонной разметки;
- Missing Areas – суммарная площадь областей блоков эталонной разметки, которые не вошли в блоки, полученные при наложении, выражается в процентах по отношению к суммарной площади блоков эталонной разметки;
- Match Quality – качество наложения гибкого описания на страницу; вычисляется как доля полей, для которых уровень совпадения наложенного региона с эталонным составляет не менее 90 %. При этом для текстовых блоков процент совпадения рассчитывается по количеству правильно найденных символов, для всех остальных полей – по площади соответствующих объектов распознавания;
- Comment – комментарий к данному изображению;
- Pre-recognized – выполнено ли предраспознавание;
- Has source PDF – используется ли текстовый слой документа;
- Reference Document Number – номер документа, к которому должна относиться страница согласно эталонной сборке;
- Reference Sequence Number – номер страницы в документе, который должен быть присвоен странице согласно эталонной сборке. После номера отображается (H), если на странице должен присутствовать элемент Header, или (F), если на странице должен присутствовать элемент Footer;
- Matched Document Number номер документа, к которому отнесена данная страница в процессе наложения гибкого описания FlexiLayout;
- Matched Sequence Number номер страницы в документе, который был ей присвоен в процессе наложения гибкого описания FlexiLayout. После номера отображается (H), если на странице был найден элемент Header, или (F), если на странице был найден элемент Footer;
- Source – путь к исходному файлу изображения;
- Set Filter – фильтрация страниц по значениям колонки. Заголовок колонки, по значениям которой осуществляется фильтрация, отмечается специальным значком
. Фильтровать можно не по всем колонкам. Для сброса фильтра выберите Reset filter в контекстном меню заголовка колонки.
Замечание. Допускается выбор нескольких значений и/или колонок. В этом случае страницы, не отвечающие хотя бы одному из условий, будут скрыты. Доступно для Analyzed, Reference Alternative, Matched Alternative, Reference Document Number, Reference Sequence Number, Matched Document Number, Matched Sequence Number и Source;
- Training Layout State – степень соответствия гибкого описания документу; позволяет быстро найти страницы, которые не были полностью размечены, например, при изменении набора полей или опорных элементов. Пункт Training Layout State доступен только в режиме обучения и отображает состояние страниц, которые входят в обучающий набор. Данное свойство может принимать одно из следующих значений:
– No elements marked – на странице не размечено ни одно поле или опорный элемент;
– Has unmarked elements – на странице размечены не все поля и/или опорные элементы; не все неразмеченные элементы указаны как отсутствующие;
– Has unmarked required element – на странице не размечен элемент, указанный как обязательный;
– All elements marked – размечены все элементы, неразмеченные элементы указаны как отсутствующие;
– No reference class set – не указана эталонная альтернатива для страницы обучения.
Описание команд окна пакета при работе с классификатором
- Fit Column Width – настраивает ширину текущего столбца под максимальный размер его содержимого;
- Fit All Columns Width – настраивает ширину всех столбцов;
- Use for Training – используется ли страница при обучении;
- Page No. – номер страницы;
- Classification Fidelity – совпадают ли значения классов в столбцах Classification Result и Reference Class ;
- Reference Class – эталонный результат классификации;
- Classification Result – результат классификации (текстовая строка);
- Comment – комментарий к данному изображению;
- Pre-recognized – выполнено ли предраспознавание;
- Source – путь к исходному файлу изображения.
- Set Filter – фильтрация страниц по значениям колонки. Заголовок колонки, по значениям которой осуществляется фильтрация, отмечается специальным значком
. Фильтровать можно не по всем колонкам. Для сброса фильтра выберите Reset filter в контекстном меню заголовка колонки.
Замечание. Допускается выбор нескольких значений и/или колонок. В этом случае страницы, не отвечающие хотя бы одному из условий, будут скрыты.
Доступно для Classification Fidelity, Reference Class, Classification Result и Source.
Настройка ширины и скрытие столбцов таблицы
При щелчке левой кнопкой мыши по названию столбца в контекстном меню его состояние меняется: скрытый столбец становится видимым, а видимый – скрывается. Слева от названия видимых столбцов отображается флажок. В окне пакета должен находиться по меньшей мере один столбец. Команда скрытия единственного видимого столбца недоступна.
Местоположение и ширину столбцов также можно изменить с помощью мыши. Для изменения ширины столбца нужно перемещать его границу до необходимого значения. При изменении ширины столбца до нулевого значения, столбец становится скрытым.
Замечание. В контекстном меню пакета в ряде случаев может быть сокращено количество отображаемых пунктов меню. Например, если в свойствах гибкого описания значение параметра Allow multi-page documents установлено False, то в меню скрыты все команды, которые относятся к работе с многостраничными документами. Также в случае, когда в проекте есть всего одна альтернатива, в меню не отображается команда Match Selected Alternative.
Всплывающие подсказки
Всплывающие подсказки представляют собой небольшие окна с текстовыми описанием значения пиктограммы, на которую был наведен указатель мыши. При этом одной пиктограмме может соответствовать несколько текстовых сообщений. Например, пиктограмме в столбце Analyzed может соответствовать сообщение «Matching assembling differs from etalon» или «Matched with no reference alternative» в зависимости от состояния страницы.
Замечание. С командами контекстного меню пакета изображений можно ознакомиться на странице Контекстные меню.
13.04.2021 11:12:44