半構造化文書および未構造化文書の文書定義の作成

ABBYY FlexiCaptureは、自由書式で提示された情報(例えば、契約書、手紙、注文書、附属書など)を含む非構造化文書を処理するために使用できます。空白シートまたはバーコードページで区切られたテキストまたは画像を含む非構造化文書は、処理され、PDF検索可能ファイルまたはグラフィックファイルにエクスポートされます。

このような文書の処理には、通常、文書を電子形式に変換し、キー項目値に従って検索を実行することが含まれます。

可能であれば、ABBYY FlexiLayout Studioで作成されたFlexiLayoutを使用して、そのような文書のキーフィールド(契約番号など)の検索が実行されます。詳しくは、半構造化された文書処理のための文書定義の作成

非構造化文書の処理にNLPを使用できます。このテクノロジーでは、テキストからの情報の抽出にNLPモデルを使用します。

キーフィールドの自動検索が不可能な場合、オペレータは手動で値を入力することができます。これを行うには、1つのフィールド(または必要に応じて複数のフィールド)を含む文書定義を作成し、認識しません(イメージフィールドからのキーを手動で入力します)このフィールドの認識プロパティでオプションを有効にします。検証プロセスを実行すると、オペレータはキーフィールド値を手動で入力することができます。

データの保存を有効にするには、エクスポートを設定する設定する必要があります:キーフィールドの値をファイルまたはデータベースにエクスポートし、便利な形式で文書画像を保存することができます。文書画像は、グラフィックファイルまたはPDF検索可能なファイルに保存できます。

ページを文書に組み立てるときは細心の注意が必要です。非構造化文書の場合は、特定のページがどの文書に属するかを決定するために修正できます。非構造化文書のアセンブリを自動化するには、空白シートまたはバーコードページを使用して文書を分けることをお勧めします。バッチに画像を追加(スキャン、ファイルからの追加、またはインポートプロファイルの作成)するときは、次の方法で画像を分離オプションを有効にして値を選択するか、空白ページまたはバーコード付きのページドロップダウンリストからセパレータとして使用するページに応じて、選択する必要があります。ページは自動的に文書に組み立てられます。ページは次のセパレータページまで現在の文書に追加されます。詳細は以下を参照してください:ページ画像の追加

12.04.2024 18:16:25

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.