Japanese (日本語)

フィールド抽出の自動学習を構成すること

自動学習機能により、文書処理中のオペレータの判断でシステムが学習し、文書フィールドの検出を向上させることができます。

システムが文書上のフィールドを見つけられなかった場合、オペレータは介入してフィールドの正しい位置を示すことができます。認識され、訂正された文書が正常にエクスポートされると、システムはオペレータによって行われた訂正を学習入力として使用します。

自動学習の設定

自動学習を構成するには、次の手順を実行します：

文書定義を作成します。
文書定義のセクションプロパティで、選択しますフィールド抽出トレーニングを許可。
セクションに必要なフィールドを作成します。次を選択:領域を持つことが可能各フィールドのプロパティで。
文書定義を保存して公開します。
バッチタイプのプロパティダイアログボックスで、クリックし、ワークフロー以下を有効にします：トレーニングステージ。

ある文書から別の文書に大きく変化する同じタイプの文書の自動学習を構成するには、特定のフィールドレイアウトごとにバリアントを作成し、バリアントを区別するようにClassifier をトレーニングします。バリアントの詳細については、以下を参照：同じタイプに属する文書の変数フィールドの場所。

バリアントの設定に必要な追加手順

システムで自動学習でバリアントを使用できるようにするには、次の手順を実行します：

次の3つの方法のいずれかを使用してセクションバリアントを追加します：

バリアントを手動で登録します。これを行うには、データセットセクションプロパティのタブをクリックし、表示...ボタンをクリックします。その後、追加...ボタンをクリックしてバリアントを追加します。
データベースからバリアントを読み込みます。これを行うには、データセットセクションプロパティのタブをクリックし、セットアップ...ボタンをクリックして行ってください。ドロップダウンリストから、データベースデータソースとして選択します。
スクリプトを使用してバリアントを作成します。これを行うには、データセットセクションのプロパティをクリックし、セットアップ...ボタンをクリックして行ってください。ドロップダウンリストから、スクリプトデータソースとして選択します。

文書定義を保存して公開します。
新しく作成されたバリアントについてClassifier をトレーニングします：

モード分類子トレーニングバッチを開くに切り替え、文書画像を新しいバッチに読み込みます。
バリアントを別のクラスとして使用して、各文書に参照クラスを割り当てます。

クリッククラスを設定する...→追加...→追加...
次を選択:バリアントの指定。
リストからバリアントを選択します。

Classifier をトレーニングするには、次をクリックしますプロジェクト→分類トレーニング→学習)。

トレーニング結果を使用する際は、文書に割り当てられたバリアントを確認し、必要に応じて編集する必要があります。フォームにバリアントのIDを表示するには、サービスフィールドを作成します。詳しくは以下を参照してください：オペレータによるバリアントの変更を許可。

注：フィールド抽出トレーニングを、以下の場合、管理者が実行することもできます：オペレータが作業を開始する前にプロジェクトを訓練する必要がある場合。

管理者が文書定義を設定すると、システムはオペレータによる検証ステーションの修正から自動的に学習します。

自動学習の手順

フィールドの位置が確認され、オペレータによって修正された文書は、トレーニングバッチに配置されます。

文書はトレーニングされたFlexiLayoutの現在のバージョンと照合されます。すべてのフィールドが正しく検出された場合、FlexiLayoutを再トレーニングする必要はありません。

注：FlexiLayoutがフィールドを正しく見つけることができますが、オペレータはフィールドを変更する必要があります。文書は、古いバージョンまたは訓練されていないバージョンのFlexiLayoutを使用して処理されました。文書が検証を待っている間、システムは他のいくつかの文書でFlexiLayoutをトレーニングしました。その結果、指定された文書が正しく処理されます。

この場合、文書は以下が付くトレーニングバッチに保持されます：テスト用ステータスになります。それらは回帰テストに使用され、FlexiLayoutの将来のバージョンが劣化するのを防ぎます。

トレーニングされたFlexiLayoutが適用され、フィールド領域の一部が一致しない場合、文書は新しいバージョンのFlexiLayoutのトレーニングに使用されます。これらは以下を割り当てられます：学習用ステータスになります。

トレーニング結果はFlexiLayoutの新バージョンです。新しいバージョンと以前のバージョンを比較するには、両方とも、トレーニングバッチ内の文書学習用とテスト用そのステータスに適用されます。システムは、検出されたフィールド領域が、ユーザによって確認されたレイアウトとどれほど良好であるかをチェックします。最適な一致をもたらすFlexiLayoutは、さらなる文書処理で使用され、下位バージョンは削除されます。

12.04.2024 18:16:06

Please leave your feedback about this article

Name

E-mail

Comment

Your use of this site is conditioned on Your continued compliance with the Terms of Use.

Terms of Use

Disclaimer of Warranty

Limitation of Liability

Transmission and Submission of Information

Downloads

Use of Content

Trademarks

Links to Third-Party Sites

Foreign Legislation

Subscription Terms

Partner Subscription Terms

フィールド抽出の自動学習を構成すること

自動学習の設定

バリアントの設定に必要な追加手順

自動学習の手順

Please leave your feedback about this article