- ABBYY FlexiCaptureの導入
- プログラムのインストールと実行
- ABBYY FlexiCaptureアーキテクチャ
-
プログラム設定
- ABBYY FlexiCapture設定
- マルチテナンシー
- プロジェクトの作成
-
文書定義
- 修正済み文書定義の作成
- 半構造化文書の文書定義の作成
- 自動データ抽出が不要な文書の文書定義の作成
- 文書セット
- 文書定義フィールド
- 文書定義ウィザード
- 文書定義の編集および発行
- 文書定義の作成
- 文書定義プロパティ
- 文書定義セクションのプロパティ
- ルールの確認
- 設定のエクスポート
- 文書ウィンドウでのデータ表示の設定
- 文書定義のテスト
- 文書定義のローカライズ
- 分類
- フィールド抽出トレーニング
- 設定されたプロジェクトの操作
-
インボイス用のABBYY FlexiCapture
- インボイス用のABBYY FlexiCapture の機能
- インボイスをキャプチャする方法
- インボイスキャプチャプロジェクトを設定する方法
- 仕様
- Capturing receipts
- Capturing purchase orders
- Using NLP to process unstructured documents
- ABBYY FlexiCapture インターフェイス
-
付録
-
ABBYY FlexiCapture でのスクリプトの使用
- .Net 言語で書かれるスクリプトの仕様
- 外部アセンブリ
- オブジェクトモデル
-
処理ステージのカスタマイズのためのスクリプト
- スクリプトの種類
-
オブジェクト
- IActionResult
- IAssemblingError
- IAssemblingErrors
- IBatch
- IBatchCheckResults
- IBatchItem
- IBatchItems
- IBatchTypeClassifier
- IBatchTypeClassifierResult
- IBinarizationParams
- IBoxedBoolean
- ICharacterParams
- ICharactersParams
- ICheckmarkGroupValue
- ICheckmarkValue
- IDataSet
- IDataSetQuery
- IDataSetRecord
- IDocument
- IDocuments
- IDocumentExportResults
- IDocumentsExportResults
- IDocumentDefinitionInfo
- IDocumentDefinitionInfoArray
- IEditablePictureObject
- IExportFieldsToRedact
- IExportImageSavingOptions
- IField
- IFieldRegion
- IFieldRegions
- IFields
- IFlexiCaptureTools
- ILocalContrastParams
- IMatchedSectionInfo
- IMatchingInfo
- IPage
- IPageClassificationResult
- IPages
- IPictureObject
- IPictureObjectsInfo
- IPrincipal
- IPrincipals
- IProcessingCallback
- IProject
- IProperties
- IProperty
- IPropertyModificationInfo
- IRecordCheckResult
- IRecordset
- IRect
- IRects
- IRoutingRuleResult
- IRuleContext
- IRuleError
- IRuleErrors
- IRuleTag
- IRuleTags
- IScriptBinaryAttributes
- IScriptDefinitionContext
- ISectionDefinitionInfo
- ISectionDefinitionInfoArray
- IShadowsHighlightsParams
- IStageInfo
- IUserAttachment
- IUserAttachments
- IUserSessionInfo
- IValue
- IVARIANTArray
- TAssemlingErrorType
- TBatchItemType
- TColorToFilter
- TExportFieldType
- TExportType
- TImageCompressionType
- TPageClassificationType
- TPdfAVersion
- TPdfDocumentInfoType
- TPdfTextSearchAreaType
- TPrincipalType
- TProcessingPriority
- TPropertyType
- TRuleErrorType
- TStateType
- サンプルスクリプト
- 認識言語の内部名
-
インターフェイスイベントの処理スクリプト
- イベントハンドラ
-
オブジェクト
- IBoolean
- IBoxedFieldControl
- IDocumentEditor
- IDocumentItem
- IDocumentItems
- IDocumentsCollection
- IDocumentsWindow
- IDrawContext
- IErrorControl
- IErrorControls
- IErrorsWindow
- IFieldControl
- IFieldRegionControl
- IFieldRegionControls
- IFormWindow
- IImageWindow
- IMainMenu
- IMainWindow
- IMenu
- IMenuItem
- IPageControl
- IPageItem
- IPageItems
- IPagesCollection
- IPoint
- ISelection
- IShellRational
- IShellRect
- IShellRects
- ITaskWindow
- ITextEditor
- IToolbar
- IToolbarButton
- IToolbars
- TCommandBarType
- TCommandID
- TDockingType
- TDocumentState
- TErrorType
- TSelectionType
- TTaskWindowMode
- TTextSize
- TUserRole
- TWorkWindowType
- ウェブ検証ステーションのユーザースクリプト
- 機械による読み取りが可能なフォームの作成
- ホットキー
- 追加オプション
- 処理サーバーコマンドの説明
- FlexiCaptureバックアップ
- ABBYY FlexiCapture サンプルプロジェクト
- サポートされる認識言語
- Supported classifier languages
- 正しい文字レンダリングのためのフォント
- サポートされるテキストタイプ
- サポートされるバーコードタイプ
- 対応している入力形式
- PDF ファイルの処理
- 出力ファイル形式
- 日付形式
- 正規表現で使用されるアルファベット
- 特許
- サードパーティ技術
- 用語集
- テクニカル サポート
- ABBYY FlexiCapture の購入方法
- エンドユーザー使用許諾契約(EULA)
-
ABBYY FlexiCapture でのスクリプトの使用
Japanese (日本語) - Change language
テキストフィールド認識オプション
認識プロパティは、認識フィールドプロパティのダイアログボックスのタブで設定します(プロパティ...フィールドのショートカットメニューの項目)。正確に定義したフィールド値は、認識品質を大幅に強化して、エラー率を下げます。
表示された記入タイプフィールドで、好きな認識モードをご選択ください:標準認識,認識しないまたはスクリプト認識。
また、標準認識モードで、次のオプションを指定してください:
- ICR(手書き)このフィールドの静的テキストが手書き文字の場合は、このオプションを有効にします。 ライティングのスタイルは国によって大きく異なるで適切な国を指定する必要があります。
数字のライティングスタイルの例
ロシア 「2」 アメリカ 「2」 通常 「5」 (あらゆるスタイルで見られます) 日本 「5」 ロシア 「1」 ドイツ 「1」 通常 「9」 (あらゆるスタイルで見られます) チェコ「9」(分節に丸をつける) アメリカ 「9"」(下にフックをつけない)
- OCR(印刷)このフィールドの静的テキストが印刷文字の場合は、このオプションを有効にします。ドロップダウンリスト(印刷、ドットマトリクスプリンタ、タイプライターなど)から印刷スタイルを選択します。以下も参照:対応しているテキスト形式。
- 詳細設定このオプションを使用して、複数のテキストタイプを選択するか、カスタムのテキストタイプを指定します。このオプションでは、パターンファイルを* .ptn形式で読み込めます。ABBYY FineReader Professional / Corporate Edition 9.0(それ以前)やABBYY FineReader Engine 9.0(それ以前)でユーザーパターンを作成できます。
パターン
パターンとは、パターンのトレーニング中に作成された「文字画像そのもの」のセットです。ユーザパターンは、認識の間の追加情報源として使用されます。パターントレーニングは次の目的で使用されます:
- テキストに修飾的なフォントを設定する。
- テキストに特殊な文字が含まれている (数学記号など)。
- 印刷品質が低く、長い (1000ページ以上) 文書。
重要!パターントレーニングはアジア言語ではサポートされていません。
パターンの読み込みは、変更...をクリックします。表示されたダイアログボックスで、使用パターンを選択し、ファイルへのパスを指定します。
- マーキングタイプマーキングタイプを選択します。 選択の簡略化で、ドロップダウンリストからサンプルを選択します。スキャン中にマーキングが消えると、マーキングタイプはモノスペース(灰色のボックス)になります。スキャン中にマーキングが消えず、文字スペースのセルに分割されている場合は、合計セル数を入力する必要があります。プログラムが自動でそのようなマーキングを持つフィールドを検出すると、セルの数も自動で決定されます。
- 大文字フィールド内の文字の大文字と小文字を選択します。小文字と大文字の両方が可能な場合は、自動オプションが有効になっていることが必要です。
- 向きテキストの向きを指定します。
- CJK テキストの向き – 中国語、日本語、または韓国語の場合、OCRに使用する読み取り方向を選択します。あり得るオプションは、自動、横書き、または縦書きです。デフォルトは自動に設定されています。CJKテキストを含んでいないフィールドについてはこのオプションをおすすめします。
- そして次を有効化します→1 行1行のフィールドのオプション。
- 値が常に1つの単語で構成されるフィールドの場合、1 単語オプションを有効にします。このオプションは、フィールド内の単語数に関係なくフィールド全体に正規表現を適用する場合に、有効化できます。
注:このオプションを有効にした場合、1 単語カスタム辞書にスペース文字を含む数式を置くことはお勧めしません。
画像の事前処理設定の設定方法:
- 反転認識時に画像の色と明るさを反転させます(この反転は一時的なもので、影響するのは認識のみです。 元の画像の色は出力ファイルに保持されます)。
- 自動検出テキストの色と背景色を自動的に検出し、必要に応じて反転します。暗い背景に明るいテキスト、明るい背景に暗いテキストの両方を含むように推奨する文書設定です。
- 反転画像を完全に反転させます。
- 反転しない元の色のままにします(既定で有効)。
- テクスチャを削除テクスチャを削除
- 斑点削除このオプションを有効にすると、画像からゴミを除去します。
- 指定したサイズのゴミのみを消去指定した大きさのゴミだけ除去する場合は、このオプションを有効にしてください。ゴミの大きさを指定します。このオプションが無効で、斑点削除オプションが有効になっていると、ゴミのサイズが自動で選択されます。
そして認識しないモードを選択します。フィールドが何かの理由で認識されない場合(例:フィールド内のテキストが融合文字で構成されている場合)。オペレータはその値を手動で入力します。この場合、他の認識プロパティを設定する必要はありません。このフィールドは認識されないため、オペレータは検証中にフィールド値を入力するよう求められます。
そしてスクリプト認識カスタム認識または初期化アルゴリズムを使用する場合は、こちらのモードになります。詳しくはこちら→カスタム認識スクリプト。
14.01.2021 14:17:22