- ABBYY FlexiCaptureの導入
- プログラムのインストールと実行
- ABBYY FlexiCaptureアーキテクチャ
-
プログラム設定
- ABBYY FlexiCapture設定
- マルチテナンシー
- プロジェクトの作成
-
文書定義
- 修正済み文書定義の作成
- 半構造化文書の文書定義の作成
- 自動データ抽出が不要な文書の文書定義の作成
- 文書セット
- 文書定義フィールド
- 文書定義ウィザード
- 文書定義の編集および発行
- 文書定義の作成
- 文書定義プロパティ
- 文書定義セクションのプロパティ
- ルールの確認
- 設定のエクスポート
- 文書ウィンドウでのデータ表示の設定
- 文書定義のテスト
- 文書定義のローカライズ
- 分類
- フィールド抽出トレーニング
- 設定されたプロジェクトの操作
-
インボイス用のABBYY FlexiCapture
- インボイス用のABBYY FlexiCapture の機能
- インボイスをキャプチャする方法
- インボイスキャプチャプロジェクトを設定する方法
- 仕様
- Capturing receipts
- Capturing purchase orders
- Using NLP to process unstructured documents
- ABBYY FlexiCapture インターフェイス
-
付録
-
ABBYY FlexiCapture でのスクリプトの使用
- .Net 言語で書かれるスクリプトの仕様
- 外部アセンブリ
- オブジェクトモデル
-
処理ステージのカスタマイズのためのスクリプト
- スクリプトの種類
-
オブジェクト
- IActionResult
- IAssemblingError
- IAssemblingErrors
- IBatch
- IBatchCheckResults
- IBatchItem
- IBatchItems
- IBatchTypeClassifier
- IBatchTypeClassifierResult
- IBinarizationParams
- IBoxedBoolean
- ICharacterParams
- ICharactersParams
- ICheckmarkGroupValue
- ICheckmarkValue
- IDataSet
- IDataSetQuery
- IDataSetRecord
- IDocument
- IDocuments
- IDocumentExportResults
- IDocumentsExportResults
- IDocumentDefinitionInfo
- IDocumentDefinitionInfoArray
- IEditablePictureObject
- IExportFieldsToRedact
- IExportImageSavingOptions
- IField
- IFieldRegion
- IFieldRegions
- IFields
- IFlexiCaptureTools
- ILocalContrastParams
- IMatchedSectionInfo
- IMatchingInfo
- IPage
- IPageClassificationResult
- IPages
- IPictureObject
- IPictureObjectsInfo
- IPrincipal
- IPrincipals
- IProcessingCallback
- IProject
- IProperties
- IProperty
- IPropertyModificationInfo
- IRecordCheckResult
- IRecordset
- IRect
- IRects
- IRoutingRuleResult
- IRuleContext
- IRuleError
- IRuleErrors
- IRuleTag
- IRuleTags
- IScriptBinaryAttributes
- IScriptDefinitionContext
- ISectionDefinitionInfo
- ISectionDefinitionInfoArray
- IShadowsHighlightsParams
- IStageInfo
- IUserAttachment
- IUserAttachments
- IUserSessionInfo
- IValue
- IVARIANTArray
- TAssemlingErrorType
- TBatchItemType
- TColorToFilter
- TExportFieldType
- TExportType
- TImageCompressionType
- TPageClassificationType
- TPdfAVersion
- TPdfDocumentInfoType
- TPdfTextSearchAreaType
- TPrincipalType
- TProcessingPriority
- TPropertyType
- TRuleErrorType
- TStateType
- サンプルスクリプト
- 認識言語の内部名
-
インターフェイスイベントの処理スクリプト
- イベントハンドラ
-
オブジェクト
- IBoolean
- IBoxedFieldControl
- IDocumentEditor
- IDocumentItem
- IDocumentItems
- IDocumentsCollection
- IDocumentsWindow
- IDrawContext
- IErrorControl
- IErrorControls
- IErrorsWindow
- IFieldControl
- IFieldRegionControl
- IFieldRegionControls
- IFormWindow
- IImageWindow
- IMainMenu
- IMainWindow
- IMenu
- IMenuItem
- IPageControl
- IPageItem
- IPageItems
- IPagesCollection
- IPoint
- ISelection
- IShellRational
- IShellRect
- IShellRects
- ITaskWindow
- ITextEditor
- IToolbar
- IToolbarButton
- IToolbars
- TCommandBarType
- TCommandID
- TDockingType
- TDocumentState
- TErrorType
- TSelectionType
- TTaskWindowMode
- TTextSize
- TUserRole
- TWorkWindowType
- ウェブ検証ステーションのユーザースクリプト
- 機械による読み取りが可能なフォームの作成
- ホットキー
- 追加オプション
- 処理サーバーコマンドの説明
- FlexiCaptureバックアップ
- ABBYY FlexiCapture サンプルプロジェクト
- サポートされる認識言語
- Supported classifier languages
- 正しい文字レンダリングのためのフォント
- サポートされるテキストタイプ
- サポートされるバーコードタイプ
- 対応している入力形式
- PDF ファイルの処理
- 出力ファイル形式
- 日付形式
- 正規表現で使用されるアルファベット
- 特許
- サードパーティ技術
- 用語集
- テクニカル サポート
- ABBYY FlexiCapture の購入方法
- エンドユーザー使用許諾契約(EULA)
-
ABBYY FlexiCapture でのスクリプトの使用
プロジェクト設定権限を持つユーザーによるトレーニング
トレーニングバッチのトレーニング中に、管理者はサンプルとなるインボイスのバッチを 1 社のベンダーから集め、処理中にプログラムをトレーニングします。このようなトレーニングの結果が満足できないものである場合、管理者はバッチビューに切り替え、このビューが提供するより多くのトレーニングツールを利用できます。トレーニングプロセスが終了したら、管理者はオペレータに対し、トレーニングバッチからインボイスを発行したベンダーのABBYY FlexiCapture for Invoicesでのトレーニングを禁止できます。
Training is only available if ABBYY FlexiCapture can reliably identify the vendor by finding the corresponding record in a vendor database. If you have no vendor databases but still want to use field training, you can accumulate company information by adding records to your data sets while capturing invoices. For more information, see Looking up vendors and business units in the database.
注:このセクションで説明するアクションは、管理者や次のプロジェクトを設定する権限を持つユーザーのみが実行できます:ABBYY FlexiCapture for Invoices。
トレーニングバッチビューに、追加した全ての画像が表示されます。このビューを開くには、ツールバーの(フィールド抽出トレーニングバッチを開く)をクリックするか、表示→フィールド抽出トレーニングバッチを開く。
このプログラムは、オペレータがサンプル画像を追加した全ての文書バリアントのリストを表示します。
インボイスのタイプはベンダーに基づいて決定され、ベンダーの会社と同じ名前となります。容易に検索できるよう、列には VatID(ベンダー固有の付加価値税納付番号)、IBAN、外部データベースのベンダーの ID など、ベンダーに関する情報が含まれます。
文書バリアントはこのビューで管理できます。以下の操作が可能です:
FlexiLayout バリアントのトレーニングで使用されたサンプル画像の管理
文書のバリアントをダブルクリックして、開くをショートカットメニューから選択します。この文書バリアントのサンプル画像リストが表示されます。
各サンプル画像には、以下の 3 つの状態のいずれかが該当します:
- 未使用- このサンプル画像は使用されていない
- 学習用- このサンプル画像は FlexiLayout バリアントのトレーニングとテストのために使用されている
- テスト用- このサンプル画像は FlexiLayout バリアントの試験のみに使用されている
このビューでは、FlexiLayout バリアントのトレーニングの開始に必要な画像は 1 つのみです。ただし、学習用であるサンプル画像を少なくとも 3 つ用意することをお勧めします。
トレーニング用のサンプル画像が十分でない場合は、画像を読み込み...。デフォルトで、新しく追加された画像は次のようにマークされます:未使用。
追加した画像が自動認識されない場合は、次をクリックして認識処理を強制開始してください:認識。
- 使用したい画像の状態を変更して、学習用。状態を変更するには、必要な画像を選択して右クリックして、文書の状態の設定 →学習用。この文書バリアントをトレーニングしたことがない場合は、サンプル画像の状態をすべて学習用に変更することをお勧めします。
- すべての領域のマークをチェックし、必要に応じて調整を行います。すべての領域の位置が考慮されるので、これは重要です。
- FlexiLayout バリアントのトレーニングを開始します。2 つの方法があります:
- 次を選択:プロジェクト → トレーニング →学習をメインメニューで選択するか、
- リスト内の任意の場所を右クリックして、ショートカットメニューから学習を選択するか、
- トレーニングバッチビューに切り替えて、文書バリアントのショートカットメニューから学習を選択します。
トレーニングの進捗は、文書定義を学習ウィンドウで設定できます。このトレーニングの結果として FlexiLayout バリアントが作成されます。次に、FlexiLayout バリアントは次のようにマークされた全文書でテストされます:学習用とテスト用。プログラムは FlexiLayuot を各サンプル画像に適用し(ユーザーにはこのプロセスは表示されません)、結果と参照レイアウト(ユーザーが手動で作成したレイアウト)を比較します。その後、マッチングの品質が確立されます。
新しい FlexiLayout バリアントがこの FlexiLayout バリアントの以前のバージョンやメイン FlexiLayout を上回る品質だった場合は新しい FlexiLayout バリアントが保存され、以後のデータキャプチャに使用されます。
サンプル画像の一部がトレーニングに逆効果になっていると思われるものの、それをテストに使用したい場合は、その状態をテスト用。
トレーニングの時から、これらのサンプル画像上のすべてのフィールドの領域が正しく配置されていることを確認してください。テストプロセス自体はユーザーには表示されません。
手動による微調整を目的とした FlexiLayout バリアントの FlexiLayout Studio へのエクスポート
目的の文書バリアントを右クリックして、学習した FlexiLayout をエクスポート...をショートカットメニューから選択します。
サンプル画像の追加と削除だけでは希望する結果を達成できない場合は、この作業を実行する必要があります。
FlexiLayout Studio からの FlexiLayout バリアントのインポート
目的の文書バリアントを右クリックして、FlexiLayout をインポート...をショートカットメニューから選択します。
文書バリアント用に FlexiLayout Studio で手動で作成された FlexiLayout がある場合は、これを実行しなければならないことがあります。
特定のベンダーからのインボイスのトレーニングを禁止します
目的の文書バリアントを右クリックして、オペレータによるトレーニングをロックするをショートカットメニューから選択します。
文書バリアント用の FlexiLayout が既にトレーニング済み(または手動で作成済み)で、今後のインボイス処理ではもうトレーニングが必要ではない場合にこれを実行しなければならないことがあります。
特定のベンダーからのインボイスの処理時にトレーニング結果を使用することを禁止する
目的の文書バリアントを右クリックして、無効をショートカットメニューから選択します。
文書バリアントのベンダーからのインボイスの処理時にメイン FlexiLayout のみ使用されるようにしたい場合は、このオプションを選択します。
新しいトレーニングバッチの作成
オペレータがインボイスのキャプチャを開始する前に FlexiLayout バリアントのトレーニングしたい場合は、新しいトレーニングバッチを作成します。
- トレーニングバッチビューの空欄のフィールドを右クリックして、ショートカットメニューの新規バッチ...ショートカットメニューでクリックします。
トレーニングバッチが作成されたら、関連する文書定義(プロジェクトで複数の文書定義を使用している場合)、そしてトレーニングの結果が使用されるベンダーを選択します。
- プロジェクトに複数の文書定義がある場合は、目的の文書定義を次で選択してください→文書定義を選択ダイアログボックス(バッチを右クリックして、文書の定義を変更...をショートカットメニューでクリック)。
- トレーニングバッチでベンダーを、学習機能バッチベンダーをルックアップダイアログボックス(バッチを右クリックして、ベンダーを変更...をショートカットメニューでクリック)。
トレーニングバッチビューのバッチリストには、VendorIDと文書定義列。これらの列の値によって、トレーニングバッチの文書定義とベンダーが決定されます。
注:そのバッチに割り当てられた文書定義のみを使用してバッチの文書を認識させることが重要です。
トレーニングバッチのベンダーまたは文書定義を変更するには、それを右クリックするか、ベンダーを変更...または文書定義を変更...ショートカットメニューでクリックします。
その文書定義をクリアショートカットメニューのコマンドで、バッチの文書定義の割り当てをクリアします。文書定義のないバッチはトレーニングに使用できません。
- トレーニングバッチに文書を追加します(画像を読み込み...ショートカットメニューのコマンドを使用するなど、複数の方法で実行できます)。新しい文書が自動認識されます。
- フィールド領域が正しく検出されたかどうかチェックし、必要であれば修正します。
- FlexiLayout バリアントのトレーニングに使用したい文書を複数選択し、そのうちの 1 つを右クリックして文書の状態の設定 →学習用。
- FlexiLayout バリアントのトレーニングを開始します。方法は複数あります:
- メインウィンドウで、プロジェクトメニューを開き、クリック:トレーニング→学習;
- リストの空白を右クリックして、学習ショートカットメニューでクリックします。
- トレーニングバッチビューを開き、FlexiLayout バリアントを右クリックして、学習ショートカットメニューでクリックします。
注:またFlexilayout の認識設定を使用オプションを無効化して、トレーニングしたバッチの代替案と文書定義のフルテキスト認識設定を同期できます。これにより、統一した設定を使用して文書をさらに速く処理できます。
If you wish to import into your training batch a modified or a completely new FlexiLayout to be used for one specific vendor, complete the following steps:
- In ABBYY FlexiLayout Studio, click File → Export... and in the Export FlexiLayout dialog box that opens, specify the name of the file and the folder where it should be placed.
- In ABBYY FlexiCapture, click Train Field Extraction → FlexiLayout をインポート...
If you are also using the clustering feature, please note the following limitations:
- If you are creating a new FlexiLayout manually, make sure that it covers all the possible document variants originating from the given vendor — you cannot manually create a FlexiLayout for one cluster only.
- Only a FlexiLayout for the main invoice fields will be exported. No FlexiLayout can be generated and exported for line item fields, as this type of field uses a separate machine learning algorithm, whose results cannot be exported or modified. However, you can still create a FlexiLayout for line item fields manually.
- If the clustering feature is enabled, only the FlexiLayout trained for the first cluster will be exported.
- After you import a new or modified FlexiLayout into your training batch:
- There will be no training while processing documents.
- Clustering will be disabled for this batch.
- The imported FlexiLayout will be used for processing all documents from this vendor, regardless of their cluster.
For details, see Training with clustering.
1/14/2021 2:17:22 PM