文書定義の作成は、プロジェクトを構成する上で最も重要な部分であり、処理後に得られるデータの品質を決定します。
文書定義は、文書エレメントの位置を記述し、データ抽出に使用されるフィールドを示します。
文書定義を作成するには、文書定義ウィザードを実行します:
- プロジェクト設定ステーションメインウィンドウで、選択します:プロジェクト→文書定義...
- 表示された文書定義ダイアログボックスで、新規...ボタンをクリックして行ってください。
- 文書定義ウィザードの指示に従います。
文書定義の作成の主なステージは、処理される文書のタイプによって異なります。
固定フォームの文書定義を作成する主なステージ
- 文書定義ウィザードのヘルプを使用して新しい文書定義を作成します。ウィザードが実行されている状態で、文書定義マーキングを実行するために使用される文書ページ画像を開きます。
- 静的エレメントのアンカーと識別子にマークを付け、プロパティを設定します。静的エレメントは、文書定義の一致と識別に使用されます。通常、静的エレメントは自動的に検出され、既定のプロパティが割り当てられます。
- 画像のフィールドにマークを付けます。フィールドはデータ抽出に使用されます。
- フィールドプロパティを設定します。フィールドのプロパティは、認識の品質に影響し、フィールド値がエクスポートされ、オペレータの検証を受けます。フィールドのデータタイプと値の範囲を指定します。
- 複数ページの文書の文書定義を作成します:ページを追加し、各ページのすべてのステージを繰り返します。
- データのエクスポートを設定します。
- 必要に応じて、文書ウィンドウにデータを表示する方法や、ルールなどをチェックする方法を設定できます。
- 複数の文書の画像を使用して文書定義をテストします。
注:ABBYY FormDesignerでマシン可読フォームを作成した場合は、最初の3つのステージではなく、* .xfd拡張子のファイルをインポートするだけです。準備ができたマーキングのページ画像が開きます(または、複数ページフォームを作成するためにABBYY FormDesignerを使用した場合は、いくつかの画像が表示されます)。詳細は以下を参照してください:ABBYY FormDesigner で作成されたフォームの文書定義のインポート。
半構造化文書の文書定義を作成する主なステージ
- ABBYY FlexiLayout Studioを使用して、FlexiLayout(* .afl拡張子のファイル)を作成します。詳細については、ABBYY FlexiLayout Studioのヘルプトピックを参照してください。
- 文書定義ウィザードのヘルプを使用して新しい文書定義を作成します。ウィザードを実行して、文書ページの画像を開き、FlexiLayout(作成した* .aflファイル)を添付します。ウィザードが完了すると、フィールドマーキングが画像に表示されます。
- フィールドプロパティを設定します。固定フォームの文書定義プロパティを構成する手順に従ってください。
- データのエクスポートを設定します。
- 必要に応じて、文書ウィンドウにデータを表示する方法や、ルールなどをチェックする方法を設定できます。
- 複数の文書の画像を使用して文書定義をテストします。
固定フォームと半構造セクションのページを含む混合タイプの文書では、文書定義セクションの1つとしてFlexiLayoutを添付できます。セクション(フレキシブルまたは固定)から文書定義を作成し、別のタイプの新しいセクションを追加します。
さまざまなタイプの文書を1つのフローで処理することができます。同じプロジェクトでは、固定文書、半構造化文書、および混在タイプ文書の文書定義を登録することができます。プログラムは適切な文書定義を自動的に選択します。
付録付きの文書を処理するには、文書定義を作成し、付録ページを有効化文書定義プロパティーでそのオプションを使用可能にします。詳しくは、付録のある文書の文書定義の作成を参照してください。
文書セット(個人ローン申込書や保険のレポートなど、同じ目的のために意図された関連文書のセット)を処理するには、文書セットの文書定義を作成します。詳しくは、文書セットを参照してください。
以下も参照してください:
文書定義