- ABBYY FlexiCaptureの導入
- プログラムのインストールと実行
- ABBYY FlexiCaptureアーキテクチャ
-
プログラム設定
- ABBYY FlexiCapture設定
- マルチテナンシー
- プロジェクトの作成
-
文書定義
- 修正済み文書定義の作成
- 半構造化文書の文書定義の作成
- 自動データ抽出が不要な文書の文書定義の作成
- 文書セット
- 文書定義フィールド
- 文書定義ウィザード
- 文書定義の編集および発行
- 文書定義の作成
- 文書定義プロパティ
- 文書定義セクションのプロパティ
- ルールの確認
- 設定のエクスポート
- 文書ウィンドウでのデータ表示の設定
- 文書定義のテスト
- 文書定義のローカライズ
- 分類
- フィールド抽出トレーニング
- 設定されたプロジェクトの操作
-
インボイス用のABBYY FlexiCapture
- インボイス用のABBYY FlexiCapture の機能
- インボイスをキャプチャする方法
- インボイスキャプチャプロジェクトを設定する方法
- 仕様
- Capturing receipts
- Capturing purchase orders
- Using NLP to process unstructured documents
- ABBYY FlexiCapture インターフェイス
-
付録
-
ABBYY FlexiCapture でのスクリプトの使用
- .Net 言語で書かれるスクリプトの仕様
- 外部アセンブリ
- オブジェクトモデル
-
処理ステージのカスタマイズのためのスクリプト
- スクリプトの種類
-
オブジェクト
- IActionResult
- IAssemblingError
- IAssemblingErrors
- IBatch
- IBatchCheckResults
- IBatchItem
- IBatchItems
- IBatchTypeClassifier
- IBatchTypeClassifierResult
- IBinarizationParams
- IBoxedBoolean
- ICharacterParams
- ICharactersParams
- ICheckmarkGroupValue
- ICheckmarkValue
- IDataSet
- IDataSetQuery
- IDataSetRecord
- IDocument
- IDocuments
- IDocumentExportResults
- IDocumentsExportResults
- IDocumentDefinitionInfo
- IDocumentDefinitionInfoArray
- IEditablePictureObject
- IExportFieldsToRedact
- IExportImageSavingOptions
- IField
- IFieldRegion
- IFieldRegions
- IFields
- IFlexiCaptureTools
- ILocalContrastParams
- IMatchedSectionInfo
- IMatchingInfo
- IPage
- IPageClassificationResult
- IPages
- IPictureObject
- IPictureObjectsInfo
- IPrincipal
- IPrincipals
- IProcessingCallback
- IProject
- IProperties
- IProperty
- IPropertyModificationInfo
- IRecordCheckResult
- IRecordset
- IRect
- IRects
- IRoutingRuleResult
- IRuleContext
- IRuleError
- IRuleErrors
- IRuleTag
- IRuleTags
- IScriptBinaryAttributes
- IScriptDefinitionContext
- ISectionDefinitionInfo
- ISectionDefinitionInfoArray
- IShadowsHighlightsParams
- IStageInfo
- IUserAttachment
- IUserAttachments
- IUserSessionInfo
- IValue
- IVARIANTArray
- TAssemlingErrorType
- TBatchItemType
- TColorToFilter
- TExportFieldType
- TExportType
- TImageCompressionType
- TPageClassificationType
- TPdfAVersion
- TPdfDocumentInfoType
- TPdfTextSearchAreaType
- TPrincipalType
- TProcessingPriority
- TPropertyType
- TRuleErrorType
- TStateType
- サンプルスクリプト
- 認識言語の内部名
-
インターフェイスイベントの処理スクリプト
- イベントハンドラ
-
オブジェクト
- IBoolean
- IBoxedFieldControl
- IDocumentEditor
- IDocumentItem
- IDocumentItems
- IDocumentsCollection
- IDocumentsWindow
- IDrawContext
- IErrorControl
- IErrorControls
- IErrorsWindow
- IFieldControl
- IFieldRegionControl
- IFieldRegionControls
- IFormWindow
- IImageWindow
- IMainMenu
- IMainWindow
- IMenu
- IMenuItem
- IPageControl
- IPageItem
- IPageItems
- IPagesCollection
- IPoint
- ISelection
- IShellRational
- IShellRect
- IShellRects
- ITaskWindow
- ITextEditor
- IToolbar
- IToolbarButton
- IToolbars
- TCommandBarType
- TCommandID
- TDockingType
- TDocumentState
- TErrorType
- TSelectionType
- TTaskWindowMode
- TTextSize
- TUserRole
- TWorkWindowType
- ウェブ検証ステーションのユーザースクリプト
- 機械による読み取りが可能なフォームの作成
- ホットキー
- 追加オプション
- 処理サーバーコマンドの説明
- FlexiCaptureバックアップ
- ABBYY FlexiCapture サンプルプロジェクト
- サポートされる認識言語
- Supported classifier languages
- 正しい文字レンダリングのためのフォント
- サポートされるテキストタイプ
- サポートされるバーコードタイプ
- 対応している入力形式
- PDF ファイルの処理
- 出力ファイル形式
- 日付形式
- 正規表現で使用されるアルファベット
- 特許
- サードパーティ技術
- 用語集
- テクニカル サポート
- ABBYY FlexiCapture の購入方法
- エンドユーザー使用許諾契約(EULA)
-
ABBYY FlexiCapture でのスクリプトの使用
管理者によるフィールド抽出トレーニング
フィールド抽出トレーニングは、オペレータが作業を開始する前にプロジェクトを訓練する必要がある管理者が行うことができます。自動学習が不十分であると判明した場合は、管理者によるトレーニングが必要になることもあります。
標準シナリオ
標準的なシナリオでは、次の手順を実行します:
- 文書定義を作成します。
- 文書定義のセクションプロパティで、選択します フィールド抽出トレーニングを許可 。
- セクションに必要なフィールドを作成します。次を選択: 領域を持つことが可能 各フィールドのプロパティで。
- 文書定義を保存して公開します。
- モード フィールド抽出用トレーニングバッチ に切り替え、新しいバッチを作成します。
- 作成した文書定義を選択します。
- 次を選択: デフォルトのバリアント バリアントのリストから。
- 文書画像を読み込んで認識します。文書の種類ごとに3〜50枚の画像を読み込むことをお勧めします。
- フィールドの位置を調整します。
- フィールドを抽出するプログラムをトレーニングします:
- 文書の一部を選択し、選択したものを右クリックし、 文書の状態の設定 → 学習用 をショートカットメニューでクリックします。
- 残りの文書を選択し、選択範囲を右クリックして、 文書の状態の設定 → テスト用 ショートカットメニューでクリックします。
- 以下をクリックします: プロジェクト→フィールドトレーニング→ 学習 。
注:
トレーニングバッチではトレーニング用の文書の60%、テストでは残りの40%を使用することをお勧めします。
複数の文書バリアントを持つプロジェクト
可変フィールドロケーションを持つ文書の場合、バリアントを作成し、これらのバリアントを区別するためにClassifier をトレーニングする必要があります。可変フィールドロケーションとバリアントを持つドキュメントの詳細については、以下を参照: 同じタイプに属する文書の変数フィールドの場所 。
次の手順を実行します:
- 文書定義を作成します。
- 文書定義のセクションプロパティで、選択します フィールド抽出トレーニングを許可 。
- セクションに必要なフィールドを作成します。次を選択: 領域を持つことが可能 各フィールドのプロパティ。
- 次の3つの方法のいずれかを使用してセクションバリアントを追加します :
- バリアントを手動で登録します。これを行うには、 データセット セクションプロパティのタブをクリックし、 表示... ボタンをクリックして行ってください。その後、 追加... ボタンをクリックしてバリアントを追加します。
- データベースからバリアントを読み込みます。これを行うには、 データセット セクションプロパティのタブをクリックし、 セットアップ... ボタンをクリックして行ってください。ドロップダウンリストから、 データベース データソースとして選択します。
- スクリプトを使用してバリアントを作成します。これを行うには、 データセット セクションのプロパティをクリックし、 セットアップ... ボタンをクリックして行ってください。ドロップダウンリストから、 スクリプト データソースとして選択します。
- 文書定義を保存して公開します。
- 新しく作成されたバリアントについてClassifier をトレーニングします:
- モード 分類子トレーニングバッチを開く に切り替え、文書画像を新しいバッチに読み込みます。
- バリアントを別のクラスとして使用して、各文書に参照クラスを割り当てます。
- クリック クラスを設定する... →追加...→追加...
- 次を選択: バリアントの指定 。
- リストからバリアントを選択します。
- Classifier をトレーニングするには、次をクリックします: プロジェクト→分類トレーニング→ 学習 。
注:
FlexiLayout StudioでClassifier を作成し、それを以下にインポートすることができます:
ABBYY
FlexiCapture。詳しくは以下を参照してください:
Classifierのエクスポートとインポート
。
- ABBYY FlexiCaptureをトレーニングして、各バリアントのフィールド領域を検出します:
- モード フィールド抽出用トレーニングバッチ に切り替えます。
- 新しいバッチを作成します。文書定義を選択し、トレーニングするバリアントを選択します。
- 文書画像を読み込んで認識します。文書の種類ごとに3〜50枚の画像を読み込むことをお勧めします。
- フィールドの位置を調整します。
- フィールドを抽出するプログラムをトレーニングします:
- 文書の一部を選択し、選択したものを右クリックし、 文書の状態の設定 → 学習用 ショートカットメニューでクリックします。
- 残りの文書を選択し、選択範囲を右クリックして、 文書の状態の設定 → テスト用 ショートカットメニューでクリックします。
- クリック プロジェクト→フィールドトレーニング→ 学習 。
トレーニング結果を使用する際は、文書に割り当てられたバリアントを確認し、必要に応じて編集する必要があります。フォームにバリアントのIDを表示するには、 サービスフィールドを作成します 。詳しくは以下を参照してください: オペレータによるバリアントの変更を許可 。
注:
以下を推奨します:
フィールド抽出の自動学習を構成すること
。自動学習が設定されていると、設定されたプロジェクトでオペレータが作業するので、プログラムは自動的にフィールドを抽出します。
14.01.2021 14:17:22