事前認識
事前認識は、半構造化文書を処理する最初の段階です。コンピュータ処理を想定して設計された固定文書とは異なり、非構造化文書には異なる構造があり、データフィールドはページの異なる部分に配置されます。これを理由として、文書のオブジェクトを検出し、データフィールドの位置を伝えるために、事前認識を使用します。
事前認識は、文書分析の最初の段階です。事前認識には相当時間がかかるため、FlexiLayout Studioでは、FlexiLayout合致から独立して事前認識を1回実行し、FlexiLayoutを作成、試験することに集中できるようになっています。
それでも、FlexiLayout作成を開始する前に、事前認識結果の質を評価しなければなりません。事前認識の質は、バッチの試験画像の質に左右されます。試験画像の質は、明るさ、コントラスト、解像度などのスキャンパラメータに左右されます。事前認識結果の質に満足できない場合は、スキャンオプションを変更して試験文書を再スキャンすることもできます。FlexiLayout Studioでは、異なる解像度でスキャンした画像を追加して、事前認識で実験を行い、FlexiLayoutと合致させて、最適なスキャンオプションを選択することができるようになっています。
事前認識は高速またはフルモードで実行できます(詳細は事前認識パラメータ 参照)。FlexiLayoutの試行中は、事前認識は完全である必要はありません。いくつかの認識エラーがある場合でも、ほぼあらゆるデータフィールドを見つける方法は常にあります。実際、事前認識の速度は質よりも重要な場合があります。認識の質は、各フィールドのデータ種類を指定できるデータキャプチャアプリケーションの後の段階で考慮され、それによって認識の質が大幅に向上することがあります。
事前認識中、さまざまな色のドットの位置が分析され、基本的なオブジェクトが検出され、テキスト断片が単語と行に結合されます。
以下の基本オブジェクトの種類が検出されます:
- テキスト
- 画像
- 句読点
- 反転テキスト
- 区切り
- バーコード
- チェックマーク
基本オブジェクトが検出されると、テキストオブジェクトの認識が始まります。認識されたテキストは、以下の2種類で表示できます:
- 認識された単語
- 認識された行
詳細:
12.04.2024 18:16:07