- ABBYY FlexiCaptureの導入
- プログラムのインストールと実行
- ABBYY FlexiCaptureアーキテクチャ
-
プログラム設定
- ABBYY FlexiCapture設定
- マルチテナンシー
- プロジェクトの作成
-
文書定義
- 修正済み文書定義の作成
- 半構造化文書の文書定義の作成
- 自動データ抽出が不要な文書の文書定義の作成
- 文書セット
- 文書定義フィールド
- 文書定義ウィザード
- 文書定義の編集および発行
- 文書定義の作成
- 文書定義プロパティ
- 文書定義セクションのプロパティ
- ルールの確認
- 設定のエクスポート
- 文書ウィンドウでのデータ表示の設定
- 文書定義のテスト
- 文書定義のローカライズ
- 分類
- フィールド抽出トレーニング
- 設定されたプロジェクトの操作
-
インボイス用のABBYY FlexiCapture
- インボイス用のABBYY FlexiCapture の機能
- インボイスをキャプチャする方法
- インボイスキャプチャプロジェクトを設定する方法
- 仕様
- Capturing receipts
- Capturing purchase orders
- Using NLP to process unstructured documents
- ABBYY FlexiCapture インターフェイス
-
付録
-
ABBYY FlexiCapture でのスクリプトの使用
- .Net 言語で書かれるスクリプトの仕様
- 外部アセンブリ
- オブジェクトモデル
-
処理ステージのカスタマイズのためのスクリプト
- スクリプトの種類
-
オブジェクト
- IActionResult
- IAssemblingError
- IAssemblingErrors
- IBatch
- IBatchCheckResults
- IBatchItem
- IBatchItems
- IBatchTypeClassifier
- IBatchTypeClassifierResult
- IBinarizationParams
- IBoxedBoolean
- ICharacterParams
- ICharactersParams
- ICheckmarkGroupValue
- ICheckmarkValue
- IDataSet
- IDataSetQuery
- IDataSetRecord
- IDocument
- IDocuments
- IDocumentExportResults
- IDocumentsExportResults
- IDocumentDefinitionInfo
- IDocumentDefinitionInfoArray
- IEditablePictureObject
- IExportFieldsToRedact
- IExportImageSavingOptions
- IField
- IFieldRegion
- IFieldRegions
- IFields
- IFlexiCaptureTools
- ILocalContrastParams
- IMatchedSectionInfo
- IMatchingInfo
- IPage
- IPageClassificationResult
- IPages
- IPictureObject
- IPictureObjectsInfo
- IPrincipal
- IPrincipals
- IProcessingCallback
- IProject
- IProperties
- IProperty
- IPropertyModificationInfo
- IRecordCheckResult
- IRecordset
- IRect
- IRects
- IRoutingRuleResult
- IRuleContext
- IRuleError
- IRuleErrors
- IRuleTag
- IRuleTags
- IScriptBinaryAttributes
- IScriptDefinitionContext
- ISectionDefinitionInfo
- ISectionDefinitionInfoArray
- IShadowsHighlightsParams
- IStageInfo
- IUserAttachment
- IUserAttachments
- IUserSessionInfo
- IValue
- IVARIANTArray
- TAssemlingErrorType
- TBatchItemType
- TColorToFilter
- TExportFieldType
- TExportType
- TImageCompressionType
- TPageClassificationType
- TPdfAVersion
- TPdfDocumentInfoType
- TPdfTextSearchAreaType
- TPrincipalType
- TProcessingPriority
- TPropertyType
- TRuleErrorType
- TStateType
- サンプルスクリプト
- 認識言語の内部名
-
インターフェイスイベントの処理スクリプト
- イベントハンドラ
-
オブジェクト
- IBoolean
- IBoxedFieldControl
- IDocumentEditor
- IDocumentItem
- IDocumentItems
- IDocumentsCollection
- IDocumentsWindow
- IDrawContext
- IErrorControl
- IErrorControls
- IErrorsWindow
- IFieldControl
- IFieldRegionControl
- IFieldRegionControls
- IFormWindow
- IImageWindow
- IMainMenu
- IMainWindow
- IMenu
- IMenuItem
- IPageControl
- IPageItem
- IPageItems
- IPagesCollection
- IPoint
- ISelection
- IShellRational
- IShellRect
- IShellRects
- ITaskWindow
- ITextEditor
- IToolbar
- IToolbarButton
- IToolbars
- TCommandBarType
- TCommandID
- TDockingType
- TDocumentState
- TErrorType
- TSelectionType
- TTaskWindowMode
- TTextSize
- TUserRole
- TWorkWindowType
- ウェブ検証ステーションのユーザースクリプト
- 機械による読み取りが可能なフォームの作成
- ホットキー
- 追加オプション
- 処理サーバーコマンドの説明
- FlexiCaptureバックアップ
- ABBYY FlexiCapture サンプルプロジェクト
- サポートされる認識言語
- Supported classifier languages
- 正しい文字レンダリングのためのフォント
- サポートされるテキストタイプ
- サポートされるバーコードタイプ
- 対応している入力形式
- PDF ファイルの処理
- 出力ファイル形式
- 日付形式
- 正規表現で使用されるアルファベット
- 特許
- サードパーティ技術
- 用語集
- テクニカル サポート
- ABBYY FlexiCapture の購入方法
- エンドユーザー使用許諾契約(EULA)
-
ABBYY FlexiCapture でのスクリプトの使用
文書処理中のトレーニング
ABBYY FlexiCapture for Invoicesによって、文書の処理中に認識品質を強化できます。プログラムが文書画像でフィールドの位置を正しく決定できなかった場合、オペレータは正しい位置を指定できます。プログラムはこの場所を保存し、他の文書を認識する時に使用します。
Training is only available if ABBYY FlexiCapture can reliably identify the vendor by finding the corresponding record in a vendor database. If you have no vendor databases but still want to use field training, you can accumulate company information by adding records to your data sets while capturing invoices. For more information, see Looking up vendors and business units in the database.
この記事はABBYY FlexiCapture for Invoicesのローカルにインストールした検証ステーションを使ったトレーニング方法について説明するほか、オペレータが把握しておくべきトレーニング関連の問題についても触れます。
- インボイスのバッチ(先月処理したインボイスなど)を収集し、プログラムへのフィードを開始します。詳しくは、インボイスをキャプチャする方法を参照してください。
- プログラムにフィードされた文書は自動認識されます。この動作は、追加画像を自動的に認識オプションダイアログボックスの文書処理タブでそのオプションがで有効になっている場合のみ発生します。このダイアログはツール→オプション...をクリックして開きます。データは検証ルールによってチェックされます。
- 認識されたインボイスのステータスが有効以外の場合、または何らかの理由でプログラムが一部のフィールド検出に失敗したと考えられる場合は、文書エディタで文書を開きます。
- 文書フォームをレビューします。そのベンダーグループのフィールドは正しく入力してください。
詳細...
トレーニングは各文書バリアントで独立して実行されます。同一のベンダーからのインボイスは同一の文書バリアントに属するものと見なされます。ベンダーが誤って検出されると、トレーニング実行中にインボイスに対し、誤った文書バリアントが選択されます。プログラムがベンダーを検出できなかった場合は、ベンダー検索機能を使って正しいベンダーを選択します。データベースでベンダー見つからない場合は、画像の表示どおりにその名前を手動で入力し、次をクリックしてデータベースに保存してください→保存。
プロジェクトの設定によっては、インボイスのベンダーの固有 ID を指定し、プログラムがそのインボイスでトレーニングできるようにしなければならない場合もあります。その場合は、固有 ID をVAT IDフィールドに入力します(プロジェクトの一部地域ではこのフィールドの名前が異なる場合もあります)。そのVAT IDは、付加価値税のために企業に割り当てられた固有の識別番号です。
If documents originating from the same vendor have widely varying layouts, you should use the clustering feature. For details, see Training with clustering.
- トレーニングは、すべてのフィールドの領域が正しくマークされている場合のみ成功します。そのため、領域が画像上の各フィールドの実際位置とマッチすることを確認してください。詳しくは、明細項目のトレーニングを参照してください。インボイスの明細項目のマークアップ方を詳しく記載しています。
これを実行するには、文書エディタの画像のウインドウで、領域を調整するか、プログラムが検出できなかったフィールド用に領域を描きます。
その後、プログラムは文書を分析します。フィールド領域のマークアップが修正されて、かつこのベンダーのトレーニングが禁止されていない場合、文書がバッチに追加されます。
フィールドの領域を変更する方法
- マウスのカーソルをデータフォームにある目的のフィールドに置き、画像上の対応する領域(青で強調表示されます)を見つけてクリックします(またはマウスで長方形を描きます)。
- マウスのポインタを画像上の目的の領域(青で強調表示されます)に置いてクリックします(またはマウスで領域を描きます)。次に、表示されるドロップダウンリストから対応するフィールドを選択します。
- 画像上の領域の位置を、マウスで境界線を移動させて調整します。
- 誤って認識された領域を画像から削除します。マウスポインタを長方形に置き、赤い十字が右上隅に表示されたらこれをクリックします。領域のマークアップが削除されます。次に、このフィールドの新しい領域を正しい位置に作成します。
- データフォームで、フィールドに値を入力し始めます。画像からキャプチャされ、入力中の語句に似ている語句のリストがドロップダウンリストで表示されます。このリストから正しい語句を選択すると、その語句の画像上の位置がフィールドの領域になります。
- マークアップを追加または変更したフィールドだけでなく、インボイスのすべてのフィールドがトレーニングのために使用されます。
- 次の文書でもステップ 4-6 を繰り返します。
- 同じベンダーの3番目以降のインボイスがバッチに追加されると、プログラムはトレーニング処理に入ります。プログラムは特別FlexiLayout(FlexiLayoutバリアント)をトレーニングするか、もっと例を集めるように提案します(この場合、次の文書に移ってステップ4に戻るなど)。
別のFlexiLayoutがトレーニングに成功した場合は、このインボイスのバリアントを決定する次のベンダーインボイスに使用します。認証後、フィールド領域はトレーニング結果に基づいてインボイス画像に加わります。
バッチに新しい画像が追加されると、プログラムはそのバリアントのFlexiLayoutアプリケーションの品質を決定します。追加した画像がフィールド領域のアプリケーション品質を下げる場合、画像は使用されません。その代わり、テストに使用します。 - 文書バリアントがトレーニングされているベンダーからのインボイスをさらに追加して認識させます。その後、新しく追加されたインボイスを文書エディタで 1 つずつ開き、領域が正しくマークアップされているかチェックします。領域がすべて正しく把握されたら、追加のトレーニングは必要ありません。
結果に満足できない場合は、特定のベンダーからのインボイスでプログラムのトレーニングを続行します(ステップ 4-6 を繰り返します)。これで毎回、トレーニング処理が始まります。トレーニングが成功すると、新しい FlexiLayout バリアントが作成されます。
14.01.2021 14:17:22