Russian (Русский) - Change language

Загрузка изображений и настройка классификатора

Каждому классификатору соответствует определенный пакет обучения. Для создания нового пакета обучения классификатора:

  1. Перейдите в пакеты обучения классификатора одним из следующих способов:
    • нажмите кнопку на панели инструментов;
    • выберите команду Открыть пакеты обучения классификатора в главном меню Вид или Обучение классификатора;
    • сочетанием клавиш Ctrl+Alt+Shift+B.
  2. Выберите пункт Новый пакет... контекстного меню окна списка пакетов.
  3. Задайте профиль классификации, выбрав в главном меню Обучение классификатора → Изменить профиль классификации, либо в контекстном меню пакета.
  4. Настройте баланс полноты/точности, выбрав в главном меню Обучение классификатора → Изменить приоритет полноты/точности, либо в контекстном меню пакета.
  5. Загрузите тестовую выборку документов в пакет одним из следующих способов:
    • Выберите команду Загрузить изображения из папок... на панели инструментов или в меню Файл. Выберите папку, содержащую подпапки с изображениями. В каждой подпапке должны находиться изображения, принадлежащие к одному классу.
    • Выберите команду Загрузить изображения... в контекстном меню пакета или в меню Файл.

Замечание. Предварительная обработка изображений доступна только для страниц, добавленных в пакет с помощью команды Загрузить изображения. Изображения, добавленные с помощью команды Загрузить изображения из папок... обрабатываются согласно настройкам проекта.

Замечание. В случае классификации с настроенным профилем Изображение или Комбинированный при обучении классификатора следует использовать изображения той же цветовой схемы, что и при классификации.

  1. Назначьте загруженным изображениям эталонные классы одним из следующих способов:
    • В контекстном меню документа или в меню Обучение классификатора выберите команду Назначить эталонный класс.... Эталонным классом может быть как раздел документа, так и разновидность раздела. Выберите эталонный класс из списка или создайте новый, привязав к нему раздел или разновидность.
    • Если изображения были добавлены в пакет с помощью команды Загрузить изображения из папок..., можно присвоить классы по названиям подпапок, в которых они были загружены. Выделите нужные изображения и нажмите кнопку на панели инструментов или выберите пункт меню Обучение классификатора → Назначить классы по названиям подпапок.

Замечание. Если название класса будет совпадать с названием раздела определения документа, которое этому классу соответствует, они будут связываться автоматически при нажатии кнопки Автокоррекция... в окне Соответствие классов. Подробнее см. Соответствие классов и определений документов.

Назначение эталонных классов на основании результатов классификации

Если у вас имеется большое количество несортированных изображений, которые вы планируете использовать для обучения классификатора, вы можете обучить классификатор на части выборки и назначить эталонные классы оставшимся изображениям на основании результатов классификации:

  • Назначьте эталонные классы части изображений вручную с помощь команды Назначить эталонный класс...
  • Запустите обучение классификатора (кнопка Обучение на панели инструментов, команда Обучить в меню Обучение классификатора или в контекстном меню пакета).
  • Выберите оставшиеся изображения без эталонного класса и запустите команду Классифицировать кнопкой на панели инструментов, в меню Обучение классификатора или в контекстном меню. Изображениям будет назначен результирующий класс на основании обученного классификатора.
  • Для выбранных изображений запустите команду Назначить классы на основании результатов классификации в меню Обучение классификатора или в контекстном меню. Изображениям будет назначен эталонный класс, идентичный результирующему. Для изображений, которым был назначен неправильный результирующий класс, назначьте класс вручную.

Замечание. Для того чтобы при наложении Определения документа классификатор использовал имеющийся результат распознавания, выберите опцию Использовать настройки распознавания типа пакета на вкладке Дерево классификатора в свойствах пакета обучения классификатора (контекстное меню пакета →  Свойства…). Это синхронизирует настройки полнотекстового распознавания и позволит не распознавать документы заново, что значительно уменьшит время, затраченное на классификацию.

14.01.2021 14:17:24


Please leave your feedback about this article