- ABBYY FlexiCaptureの導入
- プログラムのインストールと実行
- ABBYY FlexiCaptureアーキテクチャ
-
プログラム設定
- ABBYY FlexiCapture設定
- マルチテナンシー
- プロジェクトの作成
-
文書定義
- 修正済み文書定義の作成
- 半構造化文書の文書定義の作成
- 自動データ抽出が不要な文書の文書定義の作成
- 文書セット
- 文書定義フィールド
- 文書定義ウィザード
- 文書定義の編集および発行
- 文書定義の作成
- 文書定義プロパティ
- 文書定義セクションのプロパティ
- ルールの確認
- 設定のエクスポート
- 文書ウィンドウでのデータ表示の設定
- 文書定義のテスト
- 文書定義のローカライズ
- 分類
- フィールド抽出トレーニング
- 設定されたプロジェクトの操作
-
インボイス用のABBYY FlexiCapture
- インボイス用のABBYY FlexiCapture の機能
- インボイスをキャプチャする方法
- インボイスキャプチャプロジェクトを設定する方法
- 仕様
- Capturing receipts
- Capturing purchase orders
- Using NLP to process unstructured documents
- ABBYY FlexiCapture インターフェイス
-
付録
-
ABBYY FlexiCapture でのスクリプトの使用
- .Net 言語で書かれるスクリプトの仕様
- 外部アセンブリ
- オブジェクトモデル
-
処理ステージのカスタマイズのためのスクリプト
- スクリプトの種類
-
オブジェクト
- IActionResult
- IAssemblingError
- IAssemblingErrors
- IBatch
- IBatchCheckResults
- IBatchItem
- IBatchItems
- IBatchTypeClassifier
- IBatchTypeClassifierResult
- IBinarizationParams
- IBoxedBoolean
- ICharacterParams
- ICharactersParams
- ICheckmarkGroupValue
- ICheckmarkValue
- IDataSet
- IDataSetQuery
- IDataSetRecord
- IDocument
- IDocuments
- IDocumentExportResults
- IDocumentsExportResults
- IDocumentDefinitionInfo
- IDocumentDefinitionInfoArray
- IEditablePictureObject
- IExportFieldsToRedact
- IExportImageSavingOptions
- IField
- IFieldRegion
- IFieldRegions
- IFields
- IFlexiCaptureTools
- ILocalContrastParams
- IMatchedSectionInfo
- IMatchingInfo
- IPage
- IPageClassificationResult
- IPages
- IPictureObject
- IPictureObjectsInfo
- IPrincipal
- IPrincipals
- IProcessingCallback
- IProject
- IProperties
- IProperty
- IPropertyModificationInfo
- IRecordCheckResult
- IRecordset
- IRect
- IRects
- IRoutingRuleResult
- IRuleContext
- IRuleError
- IRuleErrors
- IRuleTag
- IRuleTags
- IScriptBinaryAttributes
- IScriptDefinitionContext
- ISectionDefinitionInfo
- ISectionDefinitionInfoArray
- IShadowsHighlightsParams
- IStageInfo
- IUserAttachment
- IUserAttachments
- IUserSessionInfo
- IValue
- IVARIANTArray
- TAssemlingErrorType
- TBatchItemType
- TColorToFilter
- TExportFieldType
- TExportType
- TImageCompressionType
- TPageClassificationType
- TPdfAVersion
- TPdfDocumentInfoType
- TPdfTextSearchAreaType
- TPrincipalType
- TProcessingPriority
- TPropertyType
- TRuleErrorType
- TStateType
- サンプルスクリプト
- 認識言語の内部名
-
インターフェイスイベントの処理スクリプト
- イベントハンドラ
-
オブジェクト
- IBoolean
- IBoxedFieldControl
- IDocumentEditor
- IDocumentItem
- IDocumentItems
- IDocumentsCollection
- IDocumentsWindow
- IDrawContext
- IErrorControl
- IErrorControls
- IErrorsWindow
- IFieldControl
- IFieldRegionControl
- IFieldRegionControls
- IFormWindow
- IImageWindow
- IMainMenu
- IMainWindow
- IMenu
- IMenuItem
- IPageControl
- IPageItem
- IPageItems
- IPagesCollection
- IPoint
- ISelection
- IShellRational
- IShellRect
- IShellRects
- ITaskWindow
- ITextEditor
- IToolbar
- IToolbarButton
- IToolbars
- TCommandBarType
- TCommandID
- TDockingType
- TDocumentState
- TErrorType
- TSelectionType
- TTaskWindowMode
- TTextSize
- TUserRole
- TWorkWindowType
- ウェブ検証ステーションのユーザースクリプト
- 機械による読み取りが可能なフォームの作成
- ホットキー
- 追加オプション
- 処理サーバーコマンドの説明
- FlexiCaptureバックアップ
- ABBYY FlexiCapture サンプルプロジェクト
- サポートされる認識言語
- Supported classifier languages
- 正しい文字レンダリングのためのフォント
- サポートされるテキストタイプ
- サポートされるバーコードタイプ
- 対応している入力形式
- PDF ファイルの処理
- 出力ファイル形式
- 日付形式
- 正規表現で使用されるアルファベット
- 特許
- サードパーティ技術
- 用語集
- テクニカル サポート
- ABBYY FlexiCapture の購入方法
- エンドユーザー使用許諾契約(EULA)
-
ABBYY FlexiCapture でのスクリプトの使用
分類子の改善
分類子改善のためのヒント
分類子によって得られた結果が満足できない場合は、次を試してください:
- 指定の分類プロファイルが適切かどうか確認してください。
- 再現率/適合率のバランスを調整します。
- 参照クラスが正しく割り当てられているか確認してください。
- より多数のサンプル文書を使用して、分類子をトレーニングしてください。トレーニングバッチにできるだけ多くの異なる文書を含めるようにしてください。トレーニングバッチが大きくてばらばらであればあるほど、分類子が検出できる同じクラスの文書バリアントが多くなります。
文書定義に一致する信頼度
分類子はある程度の信頼度で文書定義と一致します。これは、本質的に文書のクラスに紐付けられています。
信頼性の低い文書定義のセクション名は赤で表示されます。一致した場合にセクションタイプを自動的に確認するが有効になっていると、選択済みクラスに紐付けられたセクションが問題なく適用されている場合、セクション名が赤色で強調表示されることはありません。この場合、当初の一致度の信頼性が低かった場合でも、適用中にクラスが確認されます。
一致オプションでのセクションタイプの自動確認の詳細
一致した場合にセクションタイプを自動的に確認するオプションは、定義セクションプロパティの一般タブにあります。このオプションは、定義が確定済みの文書への一致しかあり得ないセクションに対して有効にしなければなりません。これは分類子付きの固定したセクション定義、または必要な要素を含むFlexiLayoutセクションであることがあります。分類子適用の結果としてそのような文書またはセクションが表示された場合、一致結果の手動確認は不要です。したがって、その手のセクション手動確認に必要な時間を、このオプションを有効にすることで短縮することが可能です。何らかの文書に一致する可能性のある定義の場合、このオプションを有効にすることは推奨できません。
手動でプログラムが信頼性の高い文書定義の一致を得られるようにしたい場合、下記の手順のいずれかを実施してください:
- ページ/文書のコンテクストメニューの文書定義を確認を使用します。
- 文書定義の一致の必要な信頼限界に達していないページを変更する(たとえば、セクションのタイプを変更したり、別の文書に移動するなど)。
- ページ/文書の文書定義を変更します。
注:オペレーターが文書を処理した後、文書に信頼度の低いセクションがなくなった場合、一致は自動的に低信頼度と見なされなくなります。
文書定義の一致の信頼度が低いため、エラーウィンドウにアセンブリエラーとして表示されます。不確定に一致した文書定義を含むエラーのある文書は、文書のアセンブリが検証されるステージに送信されます。文書が信頼性の低い分類エラーとは別のエラーを持たない場合、文書は検証ステージに送られます。
分類子トレーニングバッチのエラー検出
分類エラーは、ほとんどの場合、参照クラスの割り当ての誤りか、トレーニングバッチ内のサンプルページの不足により生じます。この種のエラーを検出するには、プログラムに対して、誤分類されたページと同じページを検索するよう命令することができます。そのためには、誤分類されたページを右クリックして、ショートカットメニュー3つのうちのひとつを選択します(これらのコマンドはトップの分類トレーニングメニューからもアクセスできます):
- 類似ページを表示する選択したページの参照または分類結果と関わりなく、バッチ全体から同様のページを検索します。
- 参照クラスの類似ページを表示する選択したページの参照クラスと同じ参照クラスをもつ同様のページを検索します。
- 結果クラスの類似ページを表示する選択したページの結果クラスと同じ参照クラスをもつ同様のページを検索します。
注:プログラムは、マークが学習用、テスト用、または未使用であるかどうかに関わりなく、全文書から同じページを検索します。
同様のページが、類似性の降順で、似たものから似ていないものへと表示されます。
実際の例
混同マトリックス内で誤分類されたページを特定して、このページがその参照クラスのIDと結果クラスのインボイスをもっているとします。
混同マトリックスのセルをクリックして、誤分類されたページを開きます。
そのページを右クリックしてショートカットメニューの結果クラスの類似ページを表示するをクリックします(このコマンドはトップの分類トレーニングメニューからもアクセスできます)。これで、分類子バッチ内の、IDページと同様だが参照クラスに指定されたインボイスをもつページをすべて表示します。ページが、類似性の降順で、似たものから似ていないものへと表示されます。
これで、IDページをインボイスとして分類させてしまう誤割り当て参照クラスをもつページを特定することができます。適切な場合は参照クラスを変更し、分類子を再トレーニングします。
参照クラスの類似ページを表示するコマンドをチェックすることで、ページが独自かどうかを確認できます。たとえば、その参照クラスに指定されたIDをもつトレーニングバッチに同じIDページがあるかどうかを確認するために使用できます。おなじIDページが発見されない場合、そのトレーニングバッチにはぐれページを追加して分類子を再トレーニングします。
類似ページを表示するコマンドをクリックすると、参照クラスや結果クラスに関わりなく同じページがすべて表示されます。これによりその分類子バッチ内の同じパスポートページであるページがすべて表示されますが、ID以外の参照クラスを指定済みのものについては表示されません。適切な場合は参照クラスを変更し、分類子を再トレーニングします。
1/14/2021 2:17:22 PM