文書分類スクリプト

ABBYY FlexiCapture分類子では、送信された文書が処理され、そのクラスが判別されます。これにより、フィールドの抽出で使用する文書定義を選択できます。

各分類子は特定の分類トレーニングバッチに対応します。

単一のバッチに複数の分類子を使用する場合、分類スクリプトを設定する必要があります。追加的に分類されなければならない文書がある時に、役に立ちます。この場合、最初の分類子で文書をクラスに応じて分類し、次に、分類結果に応じて追加の分類子をスクリプトから選択します。例えば、文書は最初に「請求書」と「契約書」に分類され、次に請求書は会社名に応じてさらに分類されます。

注:このスクリプトは、既存の分類トレーニングバッチに対してのみ設定でき、新しいバッチを作成する時には設定できません。

分類スクリプトを設定するには:

  1. プロジェクトプロジェクトプロパティ...と開きます。
  2. プロジェクトプロパティウィンドウの認識タブに進みます。
  3. 分類スクリプトエディタを、分類セクションのスクリプトを使用の右の設定...をクリックして、開きます。
  4. ダイアログボックスで、適切な分類子を、追加...をクリックしてリストから分類バッチを選ぶことで、選択します。
  5. これで分類子の別名を変更できます。これにより、分類子の名前が処理中に変更された場合でもスクリプトを書き直す必要がなくなります。スクリプトは、別名列で指定された特定の名前を言及します。
  6. スクリプトエディタウィンドウを、スクリプトの編集...をクリックして、開きます。

パラメータ

名前 タイプ アクセス 説明
BatchTypeClassifier IBatchTypeClassifier 読み取り専用 バッチタイプの分類子。
IsConfident bool 読み取り専用

分類の信頼度。自動分類子で作業する場合とは違い、スクリプトを使用する場合は、ページプロパティで当パラメータを手動で指定します。

Page IPage 読み取り/書き込み ドキュメントのページ
Processing IProcessingCallback 読み取り/書き込み 処理情報を記録するためのオブジェクト

スクリプトサンプル

Sample script that combines multiple classifiers for cascade classification

分類信頼度が特定の値よりも低い文書に不明クラスを割り当てるサンプルスクリプト

10.11.2020 12:08:06


Please leave your feedback about this article