自動データ抽出が不要な文書の文書定義の作成
自動フィールド抽出なしの文書定義は次の場合に役立ちます。
- 文書セットに常に必要なものの、そこからデータを抽出すべきではない、または抽出できない文書を処理するとき。例えば、手書きの明細書や通知書などが該当します。
- データを抽出することなく、文書の分類や並べ替えをするとき。
上記の場合は、文書の分析段階をスキップする文書定義を作成できます。これで検証オペレータの負担が減り、処理が速くなります。
自動フィールドを抽出せずに文書定義を作成する場合は、次の条件を満たしてください。
- 文書にはアンカーや識別子を含まないこと(あると固定形式として扱われます)。
- FlexiLayoutを読み込まないこと。
- フィールドトレーニングを有効にしないこと。
文書定義ウィザードで、自動データ抽出を必要としないドキュメントを選択します。結果として、単一セクションしか持たない文書定義が作成され、自動データ抽出が不要な文書はすべて分析ステージをスキップします。
この種の文書は通常、OCRが不要です。手動インデックス化を予定している場合、または検証オペレータが画像上でテキストをクリックしてテキストを入力できるようにする場合は、文書にテキスト層が必要です。キスト層を文書に追加する場合は、領域を持つことが可能オプションを選択した状態で、少なくとも1つのフィールドを作成します。
注:または、検索可能PDFを作成オプションを選択して、エクスポート段階で追加されたテキスト層を含めることもできます。
自動フィールド抽出をしないように、文書定義を変更することもできます。アンカーとFlexiLayoutをすべて削除し、フィールドトレーニングを無効にするだけです。
12.04.2024 18:16:06