Russian (Русский) - Change language

Обучение классификатора

Прежде чем использовать созданный классификатор, его необходимо обучить и протестировать на реальных примерах изображений. Обучение классификатора осуществляется на основании эталонных классов, установленных при настройке классификатора. При обучении классификатора у документа может быть одно из состояний:

  • Не используется – документ не используется при обучении классификатора. В режиме просмотра эскизов страниц (кнопка на панели инструментов) состояние Не используется будет отображаться соответствующим значком:
  • Для тестирования – документ используется для тестирования классификатора. В режиме просмотра эскизов страниц состояние Для тестирования будет отображаться соответствующим значком:
  • Для обучения – документ используется для обучения классификатора. Данный статус по умолчанию присваивается документам при загрузке в пакет обучения классификатора. В режиме просмотра эскизов страниц состояние Для обучения будет отображаться соответствующим значком:

Перед тем, как запустить обучение, необходимо перевести часть документов в состояние Для обучения. Это необходимо для дальнейшего анализа результатов классификации и улучшения качества созданного классификатора.

Во FlexiCapture можно автоматически разделить всю выборку на документы для обучения и тестирования. Для этого нажмите кнопку Оценка качества классификатора на панели инструментов или выберите команду главного меню Обучение классификатора → Оценка качества классификатора.... В открывшемся окне задайте процент документов, который планируется использовать для обучения и для тестирования. Там же можно задать минимальное число документов внутри каждого класса для обучения после разделения выборки (по умолчанию задано 1). После того, как заданы все значения, вы можете сразу запустить обучение: выберите опцию Запустить обучение на полученной выборке и нажмите ОК. Если вы хотите просто присвоить документам состояния и продолжить настройку классификатора, выберите опцию Только разбить выборку и нажмите ОК.

Также разбить выборку можно вручную, выделив нужные документы и выбрав команду Установить состояние документа в меню Обучение классификатора или в контекстном меню.

После настройки классификатора запустите обучение одним из следующих способов:

  • нажмите кнопку Обучение на панели инструментов;
  • выберите команду меню Обучение классификатора → Обучить;
  • выберите команду Обучить в контекстном меню.

При необходимости можно классифицировать любые страницы вне зависимости от присвоенного им состояния, для этого выделите их и выберите команду Классифицировать на панели инструментов  или в меню Обучение классификатора. Это может понадобиться, если вы хотите назначить страницам эталонный класс на основании классификации, либо для тестирования созданного классификатора на конкретных страницах.

Название результирующего и эталонного классов (или их отсутствие) будут выделены цветом, отображающим результаты классификации.

Примеры отображения результатов классификации...

После тестирования обученного классификатора на тестовой выборке вы можете просмотреть статистику и проанализировать результаты классификации.

14.01.2021 14:17:24


Please leave your feedback about this article