フィールド抽出トレーニングの範囲
フィールド抽出トレーニングは、構造化文書および半構造化文書に使用できます。トレーニングは、単純なフィールド、フィールドグループ、および繰り返しのグループで使用できます。
単純なフィールド
フィールドグループ
反復するグループ
より良い結果を得るには、トレーニング中に各タイプの文書サンプルを3〜50個アップロードすることをお勧めします。
注:フィールド抽出を微調整するには、ABBYY FlexiLayout Studioを使用します。トレーニングされた文書定義は、FlexiLayout Studioにエクスポートし、新しいFlexiLayoutの基礎として使用することができます。
同じタイプに属する文書の変数フィールドの場所
このプログラムは、同じタイプに属するが、異なる仕入先からの請求書、銀行声明、異なる州の運転免許証、さまざまな書式など、非常に異なって見える書類内の項目を検出することができます。ABBYY FlexiCaptureでは、特別な機能を使用して、そのような文書を処理することができ、これを文書のバリアントと呼ばれます。これにより、すべてのバリアントがフィールドの特定の位置に対応する場合に、同じタイプに属する文書のバリアントのセットを作成することができます。
可変ロケーションを持つフィールドのトレーニングには、文書の種類を区別するClassifierの作成とトレーニングが含まれます。詳しくは、以下を参照:Classifierの作成。文書の変形が決定されると、プログラムは一般的なフィールド抽出訓練メカニズムを使用する。
12.04.2024 18:16:06