Russian (Русский) - Change language

Практические рекомендации по улучшению качества классификации

Если классификатор по каким-то причинам показывает на выборке документов неудовлетворительные результаты, попробуйте следующие шаги:

  • проверьте, верно ли задан баланс полноты/точности;
  • увеличьте выборку документов. Чем больше будет набор документов, тем больше вариантов документов одного и того же класса будет распознаваться классификатором;
  • создайте дополнительные правила для лучшего различения классов.

Для улучшения качества классификации выполните следующие действия:

  • проверьте, верно ли задан баланс полноты/точности;
  • добавьте релевантные документы в обучающее множество. Это позволит уточнить признаки принадлежности документов к классу и оптимизировать алгоритм классификации, и, следовательно, повысить качество обученного классификатора;
  • просмотрите неправильно классифицированные документы в желтых ячейках таблицы на вкладке Confusion matrix (они открываются правой кнопкой мыши).
    Если по смыслу текста и по выделенным признакам вы убедитесь, что эталонный класс у документа была определен неверно, то переопределите класс. Если документу невозможно однозначно определить эталонный класс, удалите его из обучающего множества;
  • Возможно, в обучающей выборке присутствуют тематически близкие классы, задача распределения документов между которыми вызовет затруднения даже у эксперта. Объедините похожие классы в один;
  • создайте дополнительные правила для лучшего различения классов.

10.11.2020 12:08:08


Please leave your feedback about this article