フィールド抽出トレーニングは、オペレータが作業を開始する前にプロジェクトを訓練する必要がある管理者が行うことができます。自動学習が不十分であると判明した場合は、管理者によるトレーニングが必要になることもあります。
標準シナリオ
標準的なシナリオでは、次の手順を実行します:
- 文書定義を作成します。
- 文書定義のセクションプロパティで、選択しますフィールド抽出トレーニングを許可。
- セクションに必要なフィールドを作成します。次を選択:領域を持つことが可能各フィールドのプロパティで。
- 文書定義を保存して公開します。
- モードフィールド抽出用トレーニングバッチに切り替え、新しいバッチを作成します。
- 作成した文書定義を選択します。
- 次を選択:デフォルトのバリアントバリアントのリストから。
- 文書画像を読み込んで認識します。文書の種類ごとに3〜50枚の画像を読み込むことをお勧めします。
- フィールドの位置を調整します。
- Set the following states for your documents:
- 文書の一部を選択し、選択したものを右クリックし、文書の状態の設定 →学習用をショートカットメニューでクリックします。
- 残りの文書を選択し、選択範囲を右クリックして、文書の状態の設定 →テスト用ショートカットメニューでクリックします。
注:トレーニングバッチではトレーニング用の文書の60%、テストでは残りの40%を使用することをお勧めします。
- フィールドを抽出するプログラムをトレーニングします:
- Click Fields Training → 学習 to start the training on the same machine where the Project Setup Station component is installed.
- Right-click the batch and select Send for Training on the shortcut menu if you want the training to be performed on a Processing Station.
複数の文書バリアントを持つプロジェクト
可変フィールドロケーションを持つ文書の場合、バリアントを作成し、これらのバリアントを区別するためにClassifier をトレーニングする必要があります。可変フィールドロケーションとバリアントを持つドキュメントの詳細については、以下を参照:同じタイプに属する文書の変数フィールドの場所。
次の手順を実行します:
- 文書定義を作成します。
- 文書定義のセクションプロパティで、選択しますフィールド抽出トレーニングを許可。
- セクションに必要なフィールドを作成します。次を選択:領域を持つことが可能各フィールドのプロパティ。
- 次の3つの方法のいずれかを使用してセクションバリアントを追加します:
- バリアントを手動で登録します。これを行うには、データセットセクションプロパティのタブをクリックし、表示...ボタンをクリックして行ってください。その後、追加...ボタンをクリックしてバリアントを追加します。
- データベースからバリアントを読み込みます。これを行うには、データセットセクションプロパティのタブをクリックし、セットアップ...ボタンをクリックして行ってください。ドロップダウンリストから、データベースデータソースとして選択します。
- スクリプトを使用してバリアントを作成します。これを行うには、データセットセクションのプロパティをクリックし、セットアップ...ボタンをクリックして行ってください。ドロップダウンリストから、スクリプトデータソースとして選択します。
- 文書定義を保存して公開します。
- 新しく作成されたバリアントについてClassifier をトレーニングします:
- モード分類子トレーニングバッチを開くに切り替え、文書画像を新しいバッチに読み込みます。
- バリアントを別のクラスとして使用して、各文書に参照クラスを割り当てます。
- クリッククラスを設定する...→追加...→追加...
- 次を選択:バリアントの指定。
- リストからバリアントを選択します。
- Classifier をトレーニングするには、次をクリックします:プロジェクト→分類トレーニング→学習。
注:FlexiLayout StudioでClassifier を作成し、それを以下にインポートすることができます:ABBYYFlexiCapture。詳しくは以下を参照してください:Classifierのエクスポートとインポート。
- ABBYY FlexiCaptureをトレーニングして、各バリアントのフィールド領域を検出します:
- モードフィールド抽出用トレーニングバッチに切り替えます。
- 新しいバッチを作成します。文書定義を選択し、トレーニングするバリアントを選択します。
- 文書画像を読み込んで認識します。文書の種類ごとに3〜50枚の画像を読み込むことをお勧めします。
- フィールドの位置を調整します。
- Set the following states for your documents:
- 文書の一部を選択し、選択したものを右クリックし、文書の状態の設定 →学習用ショートカットメニューでクリックします。
- 残りの文書を選択し、選択範囲を右クリックして、文書の状態の設定 →テスト用ショートカットメニューでクリックします。
- フィールドを抽出するプログラムをトレーニングします:
- Click Fields Training →学習 to start the training on the same machine where the Project Setup Station component is installed.
- Right-click the batch and select Send for Training on the shortcut menu if you want the training to be performed on a Processing Station.
トレーニング結果を使用する際は、文書に割り当てられたバリアントを確認し、必要に応じて編集する必要があります。フォームにバリアントのIDを表示するには、サービスフィールドを作成します。詳しくは以下を参照してください:オペレータによるバリアントの変更を許可.
注:以下を推奨します:フィールド抽出の自動学習を構成すること。自動学習が設定されていると、設定されたプロジェクトでオペレータが作業するので、プログラムは自動的にフィールドを抽出します。
Sending training batches to a Processing Station for training
As the training process can take a long time and consume a lot of computational resources, the administrator can choose to train batches on a Processing Station.
注:Before sending a training batch to a Processing Station, please, make sure that:
- At least one Processing Station has been added on the Processing Server.
- The project has been uploaded to the server.
To send a training batch to a Processing Station, right-click the batch and select Send for Training on the shortcut menu. Once the batch has been sent, a training task will appear in the task queue in the Processing Server Monitor. The training itself will take place on the Processing Station. Multiple training batches can be sent for training on a Processing Station. If required, the administrator can cancel a training task in the Processing Server Monitor. Training batches sent for training will be locked until their training completes and the administrator will not be able to make any changes to such training batches.