Russian (Русский) - Change language

Типы ошибок и баланс точности/полноты

Ошибки в результатах классификации могут быть двух видов:

  1. класс документа узнан неверно: страница целевого класса А классифицирована как класс В.
  2. класс документа не узнан: страница целевого класса А была классифицирована как неизвестная.

Таким образом, качество классификации определяется двумя параметрами:

  • точность – отношение верно отнесённых к классу А документов к объединению верно и неверно отнесённых к классу А документов.

  • полнота – отношение верно отнесённых к классу А документов ко всем документам класса А.

Приоритет классификации настраивается в зависимости от целей.

Приоритет точности

Выставьте приоритет точности, чтобы уменьшить количество неверно узнанных документов. При этом не критично, если некоторые документы класса будут не узнаны.

Пример сценария с приоритетом точности:

Необходимо классифицировать инвойсы и юридические договоры для дальнейшей отправки в соответствующие департаменты.

Цена ошибочно классифицированного документа: инвойс не попадёт в нужный департамент и не будет оплачен.

Цена неузнанного документа: документы, не узнанные классификатором, будут распределены по департаментам вручную.

Таким образом, чтобы инвойс был оплачен, важнее избежать ошибочной классификации, чем не узнать класс некоторых документов.

Приоритет полноты

Выставьте приоритет полноты, чтобы все документы класса были узнаны классификатором. При этом не критично, если некоторые будут отнесены к классу ошибочно.

Пример сценария с приоритетом полноты:

Обязательные для обработки документы должны быть найдены среди документов по кредитным делам.

Цена ошибочно классифицированного документа: ошибочная отправка документов, не относящихся к классу, может быть скорректирована при дополнительной обработке, например, с помощью наложения гибкого описания FlexiLayout, валидации правилами и ручной обработкой.

Цена неузнанного документа: необходимые документы будут утеряны.

Таким образом, чтобы все необходимые документы были найдены, принципиальнее не потерять ни одного документа класса.

По умолчанию задан сбалансированный режим.

1/14/2021 2:17:24 PM


Please leave your feedback about this article