Équilibre précision/rappel

Les cas dans lesquels un classificateur ne parvient pas à classifier correctement un document se divisent en deux catégories :

  1. Le classificateur attribue la mauvaise catégorie au document, par exemple, une page de type A est classifiée en tant que type B.
  2. Le classificateur ne parvient pas à attribuer une quelconque catégorie au document.

Deux paramètres tirés de ces catégories peuvent être utilisés pour décrire la qualité de la classification :

  • Précision désigne le rapport entre les documents auxquels une catégorie spécifique a été attribuée correctement et la totalité des documents auxquels cette catégorie a été attribuée (c'est-à-dire la somme des documents auxquels cette catégorie a été attribuée correctement et des documents auxquels cette catégorie a été attribuée par erreur).

  • Rappel désigne le rapport entre les documents auxquels une catégorie a été correctement attribuée et tous les documents de cette catégorie.

Vous pouvez ajuster les paramètres de classification pour donner la priorité au rappel ou à la précision.

Donner la priorité à la précision

Si vous souhaitez que le nombre de documents avec une erreur d'attribution de catégorie soit aussi faible que possible au prix de l'absence d'attribution de catégorie à quelques documents, utilisez le paramètre Haute précision.

Exemple

Une entreprise doit classifier des factures et des contrats pour pouvoir les envoyer aux services responsables du traitement de chaque type de document.

Si FlexiCapture classifie une facture de manière erronée, celle-ci ne sera pas envoyée au bon service et ne sera pas payée. Si FlexiCapture ne procède pas à la classification d'une facture, celle-ci peut être classifiée manuellement et envoyée au bon service.

Dans ce cas, il est plus important d'éviter une classification incorrecte que de procéder à la classification du plus grand nombre de documents possible.

Donner la priorité au rappel

Si vous souhaitez que le nombre de documents auxquels aucune catégorie n'est attribuée soit aussi faible que possible au prix de l'attribution d'une catégorie erronée à quelques documents, utilisez le paramètre Rappel élevé.

Exemple

Parmi divers documents de prêt, une entreprise doit identifier ceux qui sont pertinents et doivent être traités.

Si FlexiCapture n'attribue pas une catégorie à un document pertinent, il ne sera pas traité.

Le traitement des documents auxquels une catégorie erronée a été attribuée peut être évité en utilisant un traitement supplémentaire, par exemple, en appliquant un FlexiLayout, en utilisant des règles de validation et en ayant recours au traitement manuel.

Dans ce cas, il est plus important d’attribuer une catégorie à autant de documents pertinents que possible que d'attribuer la bonne catégorie aussi souvent que possible.

Par défaut, le paramètre Priorité de classification est réglé sur Équilibré.

13.04.2021 11:12:29


Please leave your feedback about this article