分類の質を向上するためのヒント
なんらかの理由で、文書のあるバッチの特定の分類子による結果が満足いくものでない場合、下記をお試し下さい:
- 適合率 - 再現率スライダーの調整が正しいか確認してください。
- 文書の数量を大きくしてください。文書数を大きくすればするほど、同じクラスで分類子が認識する文書数も大きくなります。
- クラス同士をよりうまく区別するための追加ルールを作成してください。
分類の質を向上させるには、下記を実行します:
- 希望の適合率と再現率の値を正しく設定しているか確認してください。
- トレーニングセットに関連文書をさらに追加してください。これにより、より高精度のクラス特性と、分類アルゴリズムの最適化が考慮に入れられる結果、トレーニング済み分類子の質が向上します。
- 混同行列タブ(右クリックで表示)の表の黄色のセル内の、分類が正しくない文書を見直してください。
テキストの意味と選択された属性により、参照クラスの割り当てが正しくないことが明白な場合、正しいクラスを割り当ててください。文書の参照クラスを明確に判定できない場合、トレーニングバッチから削除してください。 - そのトレーニングバッチに語幹的に同じクラスが含まれている場合、その区別は、専門家でも困難な場合があります。同じクラスを一つに合体させてください。
- クラス間の区別を容易にするため、追加のルールを新規作成してください。
4/12/2024 6:16:07 PM