分類子統計
トレーニング実行後、分類結果が統計レポートの作成に使用されます。
- そのクラスが、ある参照クラスに対応するページに割り当てられた場合、True Positive (TP) トリガーとして分類されます。
- 参照クラスのないページにクラスが割り当てられなかった場合、True Negative (TN) トリガーとして分類されます。
- そのクラスが、ある参照クラスに対応していないページに割り当てられた場合、False Positive (FP) トリガーとして分類されます。
- 参照クラスをもつページにクラスが割り当てられなかった場合、False Negative (FN) トリガーとして分類されます。
そのように、各クラスについて符合が形成され、下記の回数が記録されます:
- 正常に割り当てあり (TP)
- 正常に割り当てなし (TN)
- 誤って割り当てあり (FP)
- 誤って割り当てなし (FN)
統計を表示するには、分類子 > 統計を表示と選択してください。
適合率、再現率、およびF値が高ければ高いほど、分類結果が向上します(F値の算出方法の詳細については、用語集を参照してください)。F値は、適合率と再現率のバランスを取った測定値で、これらのパラメータを使用した分類品質の蓄積的評価を考慮に入れたものです。F値の詳細については、分類品質向上のためのヒントセクションを参照してください。
品質評価目的においては、下記のタブにおいてさらに多くの統計も使用できます:
- 混同マトリックス。混同マトリックスは、ある分類子が最も頻繁に混同する文書を視覚的に表示したものです。マトリックスの対角線上のセルは、正しく分類された文書の数を示します。右列と最終行には、クラスが割り当てられなかった文書についての情報が記載されます。残りのセルは、誤って分類された文書を示します。
- 混乱クラス。このタブには、分類子で混ぜこぜになったクラスのリストが表示されます。この統計値は、最も頻繁に混同されるクラスを識別するために役立つことがあります。
- クラス別統計。各クラスの詳細な統計を示しており、最も頻繁に分類子の誤りの原因になっているクラスの識別が可能です。
12.04.2024 18:16:07