サンプル2。ステップ6:文書識別子の作成
ABBYY FlexiCaptureで半構造化文書を処理する時に、現在の種類に属さない文書を除外したいと思うかもしれません。文書を識別する1つの方法は、少なくとも1つの要素を必須とマークすることです。
この場合、文書見出しで優れた識別子要素が作成されます。OCRエンジンで簡単に判読できる独特なテキストを含んでいるためです。
注意:識別子要素または要素セットは事前定義されたヘッダー要素に記述できます(このサンプルでは使用されていません)。
文書の見出しは、文書を特定の種類に属す文書として識別することのみに使用され、ABBYY FlexiCaptureでは認識されません。FlexiLayoutで、文書見出しを種類静的テキストとして記述します:
- メインウィンドウでFlexiLayoutタブをクリックします。
- FlexiLayoutツリーでを選択します SearchElementsを選択します。
- FlexiLayout → 要素を追加 → 静的テキストまたは要素のショートカットメニューで静的テキストコマンドを選択します。
- 名前フィールドで、要素名前をFormHeaderなどと入力します。
- 文書見出しは必須要素なので、全般必須要素を選択します。
表示...
- 静的テキストタブをクリックします。
表示...
- テキストを検索フィールドで、探すテキストを入力します。
バッチには異なる見出しの試験文書が含まれています:Easiest RecipesまたはEasy to Cook Recipes。両方の見出しを入力します。
見出しは、すべての試験画像で1行です。従って、1行の静的テキストを迅速に検索するために、スペースなしで見出しを入力することができます。2つの代替見出しを「|」で区切ります。 - 検出されるテキストの最大エラー数を設定します(百分率点または数字で)。この場合は、最大エラー割合を20に設定し、文書見出しの25文字に5のエラーを許容することをおすすめします。
注意:最大エラー数は試行錯誤で選択されます。
12.04.2024 18:16:07