半構造化文書および未構造化文書の文書定義の作成
ABBYY FlexiCaptureは、自由書式で提示された情報(例えば、契約書、手紙、注文書、附属書など)を含む非構造化文書を処理するために使用できます。空白シートまたはバーコードページで区切られたテキストまたは画像を含む非構造化文書は、処理され、PDF検索可能ファイルまたはグラフィックファイルにエクスポートされます。
このような文書の処理には、通常、文書を電子形式に変換し、キー項目値に従って検索を実行することが含まれます。
可能であれば、ABBYY FlexiLayout Studioで作成されたFlexiLayoutを使用して、そのような文書のキーフィールド(契約番号など)の検索が実行されます。詳しくは、半構造化された文書処理のための文書定義の作成。
非構造化文書の処理にNLPを使用できます。このテクノロジーでは、テキストからの情報の抽出にNLPモデルを使用します。
キーフィールドの自動検索が不可能な場合、オペレータは手動で値を入力することができます。これを行うには、1つのフィールド(または必要に応じて複数のフィールド)を含む文書定義を作成し、認識しません(イメージフィールドからのキーを手動で入力します)このフィールドの認識プロパティでオプションを有効にします。検証プロセスを実行すると、オペレータはキーフィールド値を手動で入力することができます。
データの保存を有効にするには、エクスポートを設定する設定する必要があります:キーフィールドの値をファイルまたはデータベースにエクスポートし、便利な形式で文書画像を保存することができます。文書画像は、グラフィックファイルまたはPDF検索可能なファイルに保存できます。
ページを文書に組み立てるときは細心の注意が必要です。非構造化文書の場合は、特定のページがどの文書に属するかを決定するために修正できます。非構造化文書のアセンブリを自動化するには、空白シートまたはバーコードページを使用して文書を分けることをお勧めします。バッチに画像を追加(スキャン、ファイルからの追加、またはインポートプロファイルの作成)するときは、次の方法で画像を分離オプションを有効にして値を選択するか、空白ページまたはバーコード付きのページドロップダウンリストからセパレータとして使用するページに応じて、選択する必要があります。ページは自動的に文書に組み立てられます。ページは次のセパレータページまで現在の文書に追加されます。詳細は以下を参照してください:ページ画像の追加。
12.04.2024 18:16:25