- ABBYY FlexiCaptureの導入
- プログラムのインストールと実行
- ABBYY FlexiCaptureアーキテクチャ
-
プログラム設定
- ABBYY FlexiCapture設定
- マルチテナンシー
- プロジェクトの作成
-
文書定義
- 修正済み文書定義の作成
- 半構造化文書の文書定義の作成
- 自動データ抽出が不要な文書の文書定義の作成
- 文書セット
- 文書定義フィールド
- 文書定義ウィザード
- 文書定義の編集および発行
- 文書定義の作成
- 文書定義プロパティ
- 文書定義セクションのプロパティ
- ルールの確認
- 設定のエクスポート
- 文書ウィンドウでのデータ表示の設定
- 文書定義のテスト
- 文書定義のローカライズ
- 分類
- フィールド抽出トレーニング
- 設定されたプロジェクトの操作
-
インボイス用のABBYY FlexiCapture
- インボイス用のABBYY FlexiCapture の機能
- インボイスをキャプチャする方法
- インボイスキャプチャプロジェクトを設定する方法
- 仕様
- Capturing receipts
- Capturing purchase orders
- Using NLP to process unstructured documents
- ABBYY FlexiCapture インターフェイス
-
付録
-
ABBYY FlexiCapture でのスクリプトの使用
- .Net 言語で書かれるスクリプトの仕様
- 外部アセンブリ
- オブジェクトモデル
-
処理ステージのカスタマイズのためのスクリプト
- スクリプトの種類
-
オブジェクト
- IActionResult
- IAssemblingError
- IAssemblingErrors
- IBatch
- IBatchCheckResults
- IBatchItem
- IBatchItems
- IBatchTypeClassifier
- IBatchTypeClassifierResult
- IBinarizationParams
- IBoxedBoolean
- ICharacterParams
- ICharactersParams
- ICheckmarkGroupValue
- ICheckmarkValue
- IDataSet
- IDataSetQuery
- IDataSetRecord
- IDocument
- IDocuments
- IDocumentExportResults
- IDocumentsExportResults
- IDocumentDefinitionInfo
- IDocumentDefinitionInfoArray
- IEditablePictureObject
- IExportFieldsToRedact
- IExportImageSavingOptions
- IField
- IFieldRegion
- IFieldRegions
- IFields
- IFlexiCaptureTools
- ILocalContrastParams
- IMatchedSectionInfo
- IMatchingInfo
- IPage
- IPageClassificationResult
- IPages
- IPictureObject
- IPictureObjectsInfo
- IPrincipal
- IPrincipals
- IProcessingCallback
- IProject
- IProperties
- IProperty
- IPropertyModificationInfo
- IRecordCheckResult
- IRecordset
- IRect
- IRects
- IRoutingRuleResult
- IRuleContext
- IRuleError
- IRuleErrors
- IRuleTag
- IRuleTags
- IScriptBinaryAttributes
- IScriptDefinitionContext
- ISectionDefinitionInfo
- ISectionDefinitionInfoArray
- IShadowsHighlightsParams
- IStageInfo
- IUserAttachment
- IUserAttachments
- IUserSessionInfo
- IValue
- IVARIANTArray
- TAssemlingErrorType
- TBatchItemType
- TColorToFilter
- TExportFieldType
- TExportType
- TImageCompressionType
- TPageClassificationType
- TPdfAVersion
- TPdfDocumentInfoType
- TPdfTextSearchAreaType
- TPrincipalType
- TProcessingPriority
- TPropertyType
- TRuleErrorType
- TStateType
- サンプルスクリプト
- 認識言語の内部名
-
インターフェイスイベントの処理スクリプト
- イベントハンドラ
-
オブジェクト
- IBoolean
- IBoxedFieldControl
- IDocumentEditor
- IDocumentItem
- IDocumentItems
- IDocumentsCollection
- IDocumentsWindow
- IDrawContext
- IErrorControl
- IErrorControls
- IErrorsWindow
- IFieldControl
- IFieldRegionControl
- IFieldRegionControls
- IFormWindow
- IImageWindow
- IMainMenu
- IMainWindow
- IMenu
- IMenuItem
- IPageControl
- IPageItem
- IPageItems
- IPagesCollection
- IPoint
- ISelection
- IShellRational
- IShellRect
- IShellRects
- ITaskWindow
- ITextEditor
- IToolbar
- IToolbarButton
- IToolbars
- TCommandBarType
- TCommandID
- TDockingType
- TDocumentState
- TErrorType
- TSelectionType
- TTaskWindowMode
- TTextSize
- TUserRole
- TWorkWindowType
- ウェブ検証ステーションのユーザースクリプト
- 機械による読み取りが可能なフォームの作成
- ホットキー
- 追加オプション
- 処理サーバーコマンドの説明
- FlexiCaptureバックアップ
- ABBYY FlexiCapture サンプルプロジェクト
- サポートされる認識言語
- Supported classifier languages
- 正しい文字レンダリングのためのフォント
- サポートされるテキストタイプ
- サポートされるバーコードタイプ
- 対応している入力形式
- PDF ファイルの処理
- 出力ファイル形式
- 日付形式
- 正規表現で使用されるアルファベット
- 特許
- サードパーティ技術
- 用語集
- テクニカル サポート
- ABBYY FlexiCapture の購入方法
- エンドユーザー使用許諾契約(EULA)
-
ABBYY FlexiCapture でのスクリプトの使用
ABBYY FlexiCapture for Invoices のトレーニング
データキャプチャの品質は、トレーニングにより改善されます。 ABBYY FlexiCapture for Invoices 。ユーザーは、インボイスの処理前、または処理中にトレーニングできます。
トレーニングは、以下のような画像に以下の場合のみ行われます:
- 文書定義が画像のフィールドを正しく検出できない場合
- ユーザーが ABBYY FlexiCapture for Invoices 文書定義に含まれているもの。
トレーニングは、
タイプが同じ文書の流れの中で、フィールドの場所が標準文書の場所と異なるなど、普通ではない文書が現れた場合に便利です。もし ABBYY FlexiCapture for Invoices がそのような文書でフィールドを確実に検出できない場合は、ユーザーがフィールドの場所を正しく指示することで、プログラムはそのフィールドを検出する方法を「学習」できます。
デフォルトでサポートされているメインフィールドや追加フィールドの他にも、プログラムにとっては不明なフィールドからデータをキャプチャしなければならないことがあります。その場合は文書定義にカスタムフィールドを作成し、インボイス画像でその位置をで指定します。これでプログラムは、そのようなフィールドからもデータをキャプチャできるようになります。
通常、ベンダーはそれぞれ固有のタイプのインボイスを使用します。そのため、異なるベンダーからのインボイスは別個にトレーニングされることが必要です。異なるベンダーからのインボイスは文書バリアントとして扱われます。
動作の仕組み
ユーザーはプログラムにキャプチャをトレーニングするインボイス画像を追加します。この操作は、通常の文書処理でも特別なトレーニングモードでも可能です。追加されたインボイスは自動的に認識され、検証へ送られます。ユーザーは文書を検証し、必要であればフィールドの場所を修正して参照用レイアウトを作成します。
これでユーザーは、該当するベンダーのサンプルインボイスのセットに文書を追加できます。管理者は、インボイスの全バリアントとサンプル画像をウインドウで見ることができます。
フィールド抽出トレーニングバッチを開く
ウィンドウで設定できます。最初のサンプル画像が文書バリアントに追加されると、この文書バリアントはサンプル蓄積モードに切り替わります。
新しい文書バリアントをトレーニングするには、サンプル画像が少なくとも 3 つ必要です。プログラムに十分な数の文書画像が蓄積されると、トレーニングが自動的に開始されます。また、対応するボタンをクリックしてトレーニングプロセスを手動で開始することもできます。
トレーニングによって FlexiLayout バリアントを作成し、この文書バリアントに属するすべての文書(このベンダーの全インボイスなど)で使用できます。
トレーニングが完了すると、FlexiLayout バリアントはプログラムによって自動的にテストされます。新しく作成された FlexiLayout を適用することで、この文書バリアントのサンプル画像がすべて認識されます。
FlexiLayout の新しいバリアントの品質は、認識結果とユーザーが指定した参照用レイアウトを比較することで決まります。トレーニングが行われていない場合に使用されるメイン FlexiLayout の品質を決める時も、同じアプローチが使われます。次に、FlexiLayout バリアントの品質を前の FlexiLayout バリアントかメイン FlexiLayout の品質と比較します。
- 新しい FlexiLayout バリアントの品質が古い FlexiLayout バリアントやメイン FlexiLayout の品質を下回る場合、新しい FlexiLayout は保存されず、ウィンドウにメッセージが表示されます 文書定義を学習 ウィンドウで設定できます。
- 新しい FlexiLayout バリアントの品質が古い FlexiLayout バリアントやメイン FlexiLayout の品質を上回る場合、新しい FlexiLayout バリアントは保存され、属している文書(このベンダーからのインボイスなど)が以後の処理で使用されます。
ABBYY FlexiCapture for Invoices は、文書の処理中でもトレーニングできます。ユーザーが作業バッチに追加したインボイス画像は自動的に認識され、検証へ送られます。ユーザーは文書を検証し、必要であればフィールドの場所を修正します。 これで、該当する文書バリアントのサンプル画像セットに文書が追加されます。文書バリアントはそれぞれ、発行元のベンダーに基づいて判断されます。プログラムに十分な数のドキュメントバリアント用の文書画像が蓄積されると、トレーニングが自動的に始まります。以後プログラムは、この文書ベンダーに属している文書を処理する際にトレーニングプロセスで獲得した知識を使います。「処理中のトレーニング」は、管理者か必要な権限を持つオペレータのみ実行できます。
オペレータが文書キャプチャ中のトレーニングで望ましい結果を得られない場合、管理者は特別な表示に切り替え、
フィールド抽出トレーニングバッチを開く
特別なこの文書バリアントのトレーニングを続行することができます。管理者が実行できる操作は以下のとおりです:
- 文書バリアントのトレーニングに使用するサンプル画像セットの管理(新しい画像の追加や文書バリアントを代表していないと思われる画像の削除など)
- トレーニングバッチの作成
- トレーニング自体には使用されないものの、トレーニングで獲得される FlexiLayout バリアントのテスト時に使用されるサンプル画像の追加
- 結果として得られる FlexiLayout バリアントの ABBYY FlexiLayout Studio へのエクスポート、または ABBYY FlexiLayout Studio からの FlexiLayout のインポート
管理者は、このような追加機能によってトレーニングのメリットを最大化できます。望ましい結果が達成されたら、管理者は該当する文書バリアントについて「処理中のトレーニング」を禁止することができます。
以下も参照してください:
14.01.2021 14:17:22