FlexiLayoutの作成
FlexiLayoutは非構造化文書セットの形式化された記述で、これによってデータキャプチャアプリケーションで文書へのデータフィールド配置が可能になり、これらのフィールドからの情報抽出が可能になります。
文書の画像で検出されるべき各オブジェクトまたはオブジェクトのグループでは、FlexiLayout要素が作成されます。要素のプロパティは、対応するオブジェクトのプロパティを記述します。従って、要素から、検索対象のオブジェクトが画像、テキスト断片、またはバーコードであるか、どのくらいの大きさであるか、文書画像のどこで見つかる可能性が最も高いかが、伝えられます。
FlexiLayoutブロックから、データをキャプチャするオブジェクトの検索場所が伝えられます。ブロック座標は、直接または要素の手段で指定することができます。
ABBYY FlexiLayout Studioでは、わかりやすいビジュアルインターフェースで、要素とブロックで構成されるFlexiLayoutsを作成できるようになっています。ただ、FlexiLayoutの作成にはある程度の創造性が必要です。同じオブジェクトが複数の方法で検出できることが多く、検出方法を選ばなければいけないためです。
FlexiLayoutの作成は以下の段階からなります:
FlexiLayout Studioプロジェクトの作成 |
プロジェクトはすべてのFlexiLayoutデータが含まれるファイルです。ここで、レイアウトの正式な記述が記録され、FlexiLayoutのコンパイルと試験に使用されます。 |
文書画像のバッチの作成 |
バッチはサンプル文書画像のセットで、処理される文書のバッチ全体を描写します。 |
事前認識 |
事前認識は、ABBYY FlexiLayout Studioでテキスト断片、区切り、チェックボックスなどの画像の分割不能オブジェクトが検出されるプロセスです。事前認識で、バッチの文書で何を検索できるかを知ることができます。 |
事前認識結果の分析 |
文書が事前認識されたら、その文書を分析して、バッチのすべての文書で高い信頼性で検出可能なオブジェクトを探す必要があります。探すべきものは以下の通りです:
このようなオブジェクトが十分な数ある場合は、これらのオブジェクトに関連する文書の他のすべてのオブジェクトの位置を記述することができます。この段階では、文書の特定のオブジェクトを探す最善の方法を選択することもできます。 |
FlexiLayout要素およびブロックの作成 |
文書の他のオブジェクトを用いず検出できるオブジェクトの要素を作成する必要があります(各文書で発生するタイトルや別のテキストの断片)。これで他のオブジェクトの位置が、既に作成された要素に関連して記述されます。FlexiLayout要素は、最も信頼性の高いオブジェクトから最も信頼性の低いオブジェクトへの要素ツリーを形成します。 1セットの文書を他のセットと区別するオブジェクトが文書に含まれている場合、そのようなオブジェクトの要素を最初に作成する必要があります。1セットの文書に対して作成されたFlexiLayoutが、間違って別のセットの文書と合致することがないよう、これらのオブジェクトは識別子として使用されます。これにより、文書の処理が速まり、データのキャプチャの信頼性が高くなります。 最初に作成する要素とブロックは、ユーザーだけが決定できます。ですが、新しい要素またはブロックが作成された後、FlexiLayoutを試験することをおすすめします。試験の際に、新しい要素がすべてのサンプル画像で記述するオブジェクトの検出に使えるかを確認します。 文書を複数の論理部分に視覚的に分割し、各部分の画像オブジェクトを連続で記述すると良いでしょう。これにより、その後のFlexiLayoutのデバッグが簡単になります。 |
FlexiLayoutのコンパイル |
FlexiLayoutを構築すると、その論理と一貫性が確認されます。 |
FlexiLayoutを文書画像と合致させて試験 |
FlexiLayoutを試験するために、サンプルの文書画像と合致させます。FlexiLayoutはすべてのサンプル画像に合致するだけでなく、対応するオブジェクトが正しく検出されるようにしなければいけません。各要素またはブロックが追加された後で試験することをおすすめします。この段階でFlexiLayoutでエラーを検出しておけば、完全なFlexiLayoutで検出するよりもはるかに楽になります。文書のレイアウトが複雑な場合は特にです。 |
FlexiLayoutのエクスポート |
FlexiLayoutが完了すると、ABBYY FlexiLayout Studioからエクスポートし、データキャプチャアプリケーションにインポートできます。 |
4/12/2024 6:16:07 PM