文書処理中のトレーニング
ABBYY FlexiCapture for Invoicesによって、文書の処理中に認識品質を強化できます。プログラムが文書画像でフィールドの位置を正しく決定できなかった場合、オペレータは正しい位置を指定できます。プログラムはこの場所を保存し、他の文書を認識する時に使用します。
トレーニングを受けられるのは、ABBYY FlexiCapture がデータベース内の対応するレコードを見つけて会社を確実に特定できる場合のみです。データベースを持っていないものの、フィールドのトレーニングを使用したい場合は、文書のキャプチャ中にデータセットにレコードを追加していくことで、企業情報を蓄積することができます。詳細はこちらをご覧ください: データベースでのベンダーや部署の検索.
この記事はABBYY FlexiCapture for Invoicesのローカルにインストールした検証ステーションを使ったトレーニング方法について説明するほか、オペレータが把握しておくべきトレーニング関連の問題についても触れます。
- 文書のバッチ(先月処理したインボイスなど)を収集し、プログラムへのフィードを開始します。インボイスをキャプチャする方法を参照してください。詳しくは、インボイスをキャプチャする方法を参照してください。
- プログラムにフィードされた文書は自動認識されます。この動作は、追加画像を自動的に認識オプションダイアログボックスの文書処理タブでそのオプションがで有効になっている場合のみ発生します。このダイアログはツール→オプション...をクリックして開きます。データは検証ルールによってチェックされます。
- 認識した文書のステータスが有効以外の場合、またはプログラムが一部のフィールドの検出に失敗したと思われるその他の理由がある場合は、文書エディタで文書を開きます。
- 文書フォームをレビューします。そのベンダーグループのフィールドは正しく入力してください。
詳細...
- トレーニングは、すべてのフィールドの領域が正しくマークされている場合のみ成功します。そのため、領域が画像上の各フィールドの実際位置とマッチすることを確認してください。領域マークアップが変更され、この会社からの文書のトレーニングが禁止されていない場合、その文書はバッチに追加されます。文書のラインアイテムをマークアップする方法については、明細項目のトレーニングを参照してください。
これを実行するには、文書エディタの画像のウインドウで、領域を調整するか、プログラムが検出できなかったフィールド用に領域を描きます。
その後、プログラムは文書を分析します。領域マークアップが変更され、この会社からの文書のトレーニングが禁止されていない場合、その文書はバッチに追加されます。
フィールドの領域を変更する方法
注:プログラムは、描画したり調整したりした領域だけでなく、文書のすべてのフィールドに対してトレーニングされます。
- 次のドキュメントを開き、手順4と5を繰り返します。
- トレーニングプロセスを開始するには、トレーニングバッチに少なくとも1つの文書が含まれている必要があります。クラスタリングを使用している場合は、クラスターごとに個別のFlexiLayoutが作成され、そうでない場合は会社ごとにFlexiLayoutが作成されます(詳細はクラスターリングを使ったトレーニングを参照してください)。
- プログラムは、トレーニングされたFlexiLayoutバリアントをトレーニングバッチのすべての文書に適用し、その結果を手順5で得られた調整済みマークアップと比較することで、トレーニングされたFlexiLayoutバリアントをテストします。トレーニングされたFlexiLayoutが以前のバージョンよりも良い結果をもたらすとプログラムが決定した場合、次回この文書バリアントに属する文書を認識したときに訓練されたFlexiLayoutが使用れます。
トレーニングされたFlexiLayoutバリアントが以前のバージョンよりも悪い結果をもたらすとプログラムが決定した場合は、指定された会社の文書で訓練を続ける必要があります(手順4と5)。トレーニングされた FlexiLayout バリアントがすべてのフィールド領域を正しく識別できるようになると、トレーニング処理が完了します。
12.04.2024 18:16:25