- ABBYY FlexiCaptureの導入
- プログラムのインストールと実行
- ABBYY FlexiCaptureアーキテクチャ
-
プログラム設定
- ABBYY FlexiCapture設定
- マルチテナンシー
- プロジェクトの作成
-
文書定義
- 修正済み文書定義の作成
- 半構造化文書の文書定義の作成
- 自動データ抽出が不要な文書の文書定義の作成
- 文書セット
- 文書定義フィールド
- 文書定義ウィザード
- 文書定義の編集および発行
- 文書定義の作成
- 文書定義プロパティ
- 文書定義セクションのプロパティ
- ルールの確認
- 設定のエクスポート
- 文書ウィンドウでのデータ表示の設定
- 文書定義のテスト
- 文書定義のローカライズ
- 分類
- フィールド抽出トレーニング
- 設定されたプロジェクトの操作
-
インボイス用のABBYY FlexiCapture
- インボイス用のABBYY FlexiCapture の機能
- インボイスをキャプチャする方法
- インボイスキャプチャプロジェクトを設定する方法
- 仕様
- Capturing receipts
- Capturing purchase orders
- Using NLP to process unstructured documents
- ABBYY FlexiCapture インターフェイス
-
付録
-
ABBYY FlexiCapture でのスクリプトの使用
- .Net 言語で書かれるスクリプトの仕様
- 外部アセンブリ
- オブジェクトモデル
-
処理ステージのカスタマイズのためのスクリプト
- スクリプトの種類
-
オブジェクト
- IActionResult
- IAssemblingError
- IAssemblingErrors
- IBatch
- IBatchCheckResults
- IBatchItem
- IBatchItems
- IBatchTypeClassifier
- IBatchTypeClassifierResult
- IBinarizationParams
- IBoxedBoolean
- ICharacterParams
- ICharactersParams
- ICheckmarkGroupValue
- ICheckmarkValue
- IDataSet
- IDataSetQuery
- IDataSetRecord
- IDocument
- IDocuments
- IDocumentExportResults
- IDocumentsExportResults
- IDocumentDefinitionInfo
- IDocumentDefinitionInfoArray
- IEditablePictureObject
- IExportFieldsToRedact
- IExportImageSavingOptions
- IField
- IFieldRegion
- IFieldRegions
- IFields
- IFlexiCaptureTools
- ILocalContrastParams
- IMatchedSectionInfo
- IMatchingInfo
- IPage
- IPageClassificationResult
- IPages
- IPictureObject
- IPictureObjectsInfo
- IPrincipal
- IPrincipals
- IProcessingCallback
- IProject
- IProperties
- IProperty
- IPropertyModificationInfo
- IRecordCheckResult
- IRecordset
- IRect
- IRects
- IRoutingRuleResult
- IRuleContext
- IRuleError
- IRuleErrors
- IRuleTag
- IRuleTags
- IScriptBinaryAttributes
- IScriptDefinitionContext
- ISectionDefinitionInfo
- ISectionDefinitionInfoArray
- IShadowsHighlightsParams
- IStageInfo
- IUserAttachment
- IUserAttachments
- IUserSessionInfo
- IValue
- IVARIANTArray
- TAssemlingErrorType
- TBatchItemType
- TColorToFilter
- TExportFieldType
- TExportType
- TImageCompressionType
- TPageClassificationType
- TPdfAVersion
- TPdfDocumentInfoType
- TPdfTextSearchAreaType
- TPrincipalType
- TProcessingPriority
- TPropertyType
- TRuleErrorType
- TStateType
- サンプルスクリプト
- 認識言語の内部名
-
インターフェイスイベントの処理スクリプト
- イベントハンドラ
-
オブジェクト
- IBoolean
- IBoxedFieldControl
- IDocumentEditor
- IDocumentItem
- IDocumentItems
- IDocumentsCollection
- IDocumentsWindow
- IDrawContext
- IErrorControl
- IErrorControls
- IErrorsWindow
- IFieldControl
- IFieldRegionControl
- IFieldRegionControls
- IFormWindow
- IImageWindow
- IMainMenu
- IMainWindow
- IMenu
- IMenuItem
- IPageControl
- IPageItem
- IPageItems
- IPagesCollection
- IPoint
- ISelection
- IShellRational
- IShellRect
- IShellRects
- ITaskWindow
- ITextEditor
- IToolbar
- IToolbarButton
- IToolbars
- TCommandBarType
- TCommandID
- TDockingType
- TDocumentState
- TErrorType
- TSelectionType
- TTaskWindowMode
- TTextSize
- TUserRole
- TWorkWindowType
- ウェブ検証ステーションのユーザースクリプト
- 機械による読み取りが可能なフォームの作成
- ホットキー
- 追加オプション
- 処理サーバーコマンドの説明
- FlexiCaptureバックアップ
- ABBYY FlexiCapture サンプルプロジェクト
- サポートされる認識言語
- Supported classifier languages
- 正しい文字レンダリングのためのフォント
- サポートされるテキストタイプ
- サポートされるバーコードタイプ
- 対応している入力形式
- PDF ファイルの処理
- 出力ファイル形式
- 日付形式
- 正規表現で使用されるアルファベット
- 特許
- サードパーティ技術
- 用語集
- テクニカル サポート
- ABBYY FlexiCapture の購入方法
- エンドユーザー使用許諾契約(EULA)
-
ABBYY FlexiCapture でのスクリプトの使用
文書定義ウィザード
新しい文書定義を作成するには、またはすでに有効になっている文書定義から文書セットを新規作成するには、メインメニューでプロジェクト→ 文書定義...と選択し、新規...をクリックします。次に、処理したい文書の種類を選択します。
フォーム
フォームは固定レイアウトの文書です。すなわち、フィールドはすべてのコピーで同一に配置され、それぞれが設計者によって作成されたマスターフォームの正確な複製になっています。
フォームの文書定義の作成方法
1. 参照コピーとして使用する画像を選択します。
フォームの文書定義は、スキャンで書式を取得した画像に基づいて作成されます。フォームの場合、各フィールドの位置を示すのは書式の画像上であるため、その画像を取得しなければなりません。
注:画像は高品質のものでなければならず、斜めになったり移動したりといった歪みがあってはいけません。カラーフォームの場合、書式のスキャニング時にカラーフィルターを一切適用してはいけません。文書定義の作成のためには、背景を完全な形で維持する必要があるためです。背景除去フィルターは、スキャニングでフォームにすべてを記入した後に適用しなければなりません。
文書に複数のページが含まれている場合、最初のページを読み込み、多ページ文書の文書定義の作成セクションの推奨事項に従って、残りのページを追加します。
次へをクリックして、次のステップに進みます。
2. 文書定義のメインプロパティを、その名前、記述、文書の言語を含めて指定します。
デフォルトでは、辞書が提供されている言語のみがドロップダウン言語リストに表示されます。使用できる言語をすべて表示するには、すべての言語を表示オプションを選択します。正しい言語を指定します。誤った言語を指定すると、認識エラーを引き起こします。言語の脇に略語「ICR」がある場合、手書きの文字および機械印刷の文字を認識できます。文書の言語が事前には分からない場合、候補の言語を複数指定することができます。プログラムがその中から適切な言語を選択します。
重要!指定する言語が多すぎると、文書の処理が遅くなり、認証エラーの原因になります。
この手順で指定したテキストの種類がデフォルトで使用されますが、どのフィールドについても後でテキストの種類を変更できます(言語が異なる各種フィールドがある場合、これが必要になることがあります)。
バッチ型で指定された認識設定を使用する場合は、バッチ型の認識設定を使用オプションを選択します。
注:同期を無効にすると、文書定義の照合が遅くなることがあります。
次へをクリックして、次のステップに進みます。
3. 自動検索を希望するフィールド型を指定します。特別にマークされたテキスト入力フィールドまたはボックス内のチェックマークが検索可能です。ただし、フォーム上のテキスト入力フィールドに特別なマーキングがない場合、または説明テキストの脇にチェックマークを付ける特別なボックスがない場合、そのあり得る位置を手動で示すと良いでしょう。
注:プログラムでは常に、フォームのアンカー検出が試みられます。
終了をクリックします。文書定義エディターが開きます。ここで、ページ画像のフィールドと統計要素をマークアップして、そのプロパティを指定する必要があります。
半構造化または非構造化のドキュメント
半構造化文書または未構造化文書の場合、フィールド配置が文書ごとに異なることがあります。この種の文書からフィールドを抽出するには、FlexiLayoutを使用します。さらに、未構造化文書からフィールドを抽出するために、自然言語プロセッシング (NLP) テクノロジーを使用することもできます。
半構造化文書または未構造化文書の文書定義の作成方法
1. 参照コピーとして使用する画像を選択します(FlexiLayoutを作成する場合はオプション)。
ABBYY FlexiLayout Studioで作成されたFlexiLayoutを使用したい場合は、FlexiLayout をロードオプションを選択し、FlexiLayoutを含むファイルへのパスを指定します。詳細は、柔軟な記述に基づく文書定義の作成セクションをご参照ください。
フィールド抽出トレーニングを許可 が選択されている場合、FlexiLayoutが自動的に新規作成されます。
次へをクリックして、次のステップに進みます。
2. 文書定義のメインプロパティを、その名前、記述、文書の言語を含めて指定します。
デフォルトでは、辞書が提供されている言語のみがドロップダウン言語リストに表示されます。使用できる言語をすべて表示するには、 すべての言語を表示オプションを選択します。正しい言語を指定します。誤った言語を指定すると、認識エラーを引き起こします。言語の脇に略語「ICR」がある場合、手書きの文字および機械印刷の文字を認識できます。文書の言語が事前には分からない場合、候補の言語を複数指定することができます。プログラムがその中から適切な言語を選択します。
重要!指定する言語が多すぎると、文書の処理が遅くなり、認証エラーの原因になります。
この手順で指定したテキストの種類がデフォルトで使用されますが、どのフィールドについても後でテキストの種類を変更できます(言語が異なる各種フィールドがある場合、これが必要になることがあります)。
バッチ型で指定された認識設定を使用する場合は、バッチ型の認識設定を使用オプションを選択します。
注:同期を無効にすると、文書定義の照合が遅くなることがあります。
終了をクリックします。文書定義エディターが開きます。
自動データ抽出を必要としないドキュメント
これらは、自動フィールド検知が不要な文書です。フルテキスト検索を可能にするため、OCR技術を使用することがあります。そうでない場合、文書が認識されないままになることがあります。
このような文書を処理する目的は、これらをデジタル化し、ユーザーがキーフィールドの値に基づいて検索を実行できるようにすることです。詳細は、フィールド抽出なしの文書定義セクションをご参照ください。
自動データ抽出が不要な文書の文書定義の作成方法
1. 文書サンプルに使用する画像のソースを選択します(オプション)。
次へをクリックして、次のステップに進みます。
2. 文書定義のメインプロパティを、その名前、記述、文書の言語を含めて指定します。
デフォルトでは、辞書が提供されている言語のみがドロップダウン言語リストに表示されます。使用できる言語をすべて表示するには、すべての言語を表示オプションを選択します。正しい言語を指定します。誤った言語を指定すると、認識エラーを引き起こします。言語の脇に略語「ICR」がある場合、手書きの文字および機械印刷の文字を認識できます。文書の言語が事前には分からない場合、候補の言語を複数指定することができます。プログラムがその中から適切な言語を選択します。
重要!指定する言語が多すぎると、文書の処理が遅くなり、認証エラーの原因になります。
この手順で指定したテキストの種類がデフォルトで使用されますが、どのフィールドについても後でテキストの種類を変更できます(言語が異なる各種フィールドがある場合、これが必要になることがあります)。
バッチ型で指定された認識設定を使用する場合は、バッチ型の認識設定を使用オプションを選択します。
注:同期を無効にすると、文書定義の照合が遅くなることがあります。
終了をクリックします。
文書セット
文書セットとは、論理的に関連する文書の集合体です。文書セットの場合、他の文書定義を内包する文書定義が作成されます。オプションで、セット内の文書から収集された情報の要約セクションを含めることもできます。詳細については、文書セットの作成とセットアップセクションを参照してください。
文書セットの文書定義の作成方法
1. プロジェクトで利用できるすべての文書のリストから、文書セットに属する文書を選択します。必要な場合、サマリーセクションを追加し、セットのメインフィールドを1つのセクションにグループ化して、同じデータフォームで検証できるようにします。
次へをクリックして、次のステップに進みます。
2. 文書定義のメインプロパティを、その名前、記述、文書の言語を含めて指定します。
デフォルトでは、辞書が提供されている言語のみがドロップダウン言語リストに表示されます。使用できる言語をすべて表示するには、 すべての言語を表示オプションを選択します。正しい言語を指定します。誤った言語を指定すると、認識エラーを引き起こします。言語の脇に略語「ICR」がある場合、手書きの文字および機械印刷の文字を認識できます。文書の言語が事前には分からない場合、候補の言語を複数指定することができます。プログラムがその中から適切な言語を選択します。
重要!指定する言語が多すぎると、文書の処理が遅くなり、認証エラーの原因になります。
この手順で指定したテキストの種類がデフォルトで使用されますが、どのフィールドについても後でテキストの種類を変更できます(言語が異なる各種フィールドがある場合、これが必要になることがあります)。
バッチ型で指定された認識設定を使用する場合は、バッチ型の認識設定を使用オプションを選択します。
注:同期を無効にすると、文書定義の照合が遅くなることがあります。
終了をクリックします。
1/14/2021 2:17:22 PM