分類結果の解析
トレーニングが完了すると、統計データが記録されます。統計データの解析は、分類子の品質向上を可能にする方法のより良い理解に役立ちます。下記のいずれかの方法により、分類統計ダイアログを開くことができます。
- メインメニューで分類トレーニング → 統計を表示すると進みます。
- ツールバーの統計ボタンを押します。
新規のウィンドウで下記の内容が閲覧できます。
- F値、再現率***および***適合率 – これらの値が高ければ高いほど、分類結果の精度が高くなります(F値の算出方法の詳細については、用語集、分類、F値を参照してください)。
- 参照クラス付きページ数
- ページ分類結果:
- 真陽性 – 参照クラスに一致するクラスが割り当てられたページ数
- 偽陽性 – 参照クラスに一致しないクラスが割り当てられたページ数
- 偽陰性 – クラスが割り当てられていない参照クラスをもっていたページ数
- 真陰性 – クラスが割り当てられていない参照クラスをもっていなかったページ数
ウィンドウの上部左隅のドロップダウンリストを使用して、 分類統計 統計情報を表示するかどうかを選択してください。 テスト用 ページごとか、 学習用 ページごとか、その両方かを選択できます。
参照クラスの結果クラスに対する比率に関する詳細な内容、また、分類子トレーニングの結果に関する内容は、下記の3種の方法で確認できます:
1. 混同マトリックス。混同マトリックスは、ある分類子が最も頻繁に混同する文書を視覚的に表示したものです。マトリックスのセルの値は、参照クラスの結果クラスに対する比率を表します。緑色のセルは、クラスが正しく割り当てられたページの数を示します。赤色のセルは、混同クラス、すなわち分類子により参照クラスを付された上でページに不正に割り当てられたクラスのページ数を示します。
混同マトリックスの作業に使用するツール
混同マトリックスの表示
2. クラスによる統計。結果クラスが参照クラスと一致しなかったページの統計値を含む表。ユーザーは、任意の分類子に対して最も多くエラーを返したクラスの識別ができます。混同したページの数により、また混同ページのこの参照クラスの総ページ数に対する比率によって、ソートできます。
3. 混同クラス。このタブには、分類子により誤った割り当てがされたクラスすべての一覧が含まれています。このデータを使用して、最も頻繁に混同が生じているクラスを判定できます。
マトリックスのセルまたはデータ表の列のいずれかをダブルクリックすると、選択したクラスのページが開きます。全タブで、参照クラスと結果クラスの検索列が使用できます。また、どこクラスに最も問題があるのか明らかにするため、いずれかのデータ表をソートすることもできます。
- おもな分類指標による統計の概要:F値またはリコールまたは精度また分類結果はページごとの分類となっています。
- 等級により分類されるおもな分類指標
- 紛らわしい等級 - 紛らわしい各等級のページ数と割合
- 全等級 - 各等級のページ数と割合
統計情報は、ダイアログボックスでドキュメントの状態が選択されているページについてのみ、分類統計エクスポートされます。
重要!下記の処置のいずれかが実行済みの場合、分類子のトレーニングを再度初期化する必要があります:
- 学習用が割り当てられた文書の追加/削除
- 文書に対する 学習用状態の割り当てまたは解除
- クラスの追加、削除、または結合
- ある文書への別の参照クラスの割り当て
- 分類プロファイルおよび/または適合率-再現率優先度の修正
4/12/2024 6:16:25 PM