- ABBYY FlexiCaptureの導入
- プログラムのインストールと実行
- ABBYY FlexiCaptureアーキテクチャ
-
プログラム設定
- ABBYY FlexiCapture設定
- マルチテナンシー
- プロジェクトの作成
-
文書定義
- 修正済み文書定義の作成
- 半構造化文書の文書定義の作成
- 自動データ抽出が不要な文書の文書定義の作成
- 文書セット
- 文書定義フィールド
- 文書定義ウィザード
- 文書定義の編集および発行
- 文書定義の作成
- 文書定義プロパティ
- 文書定義セクションのプロパティ
- ルールの確認
- 設定のエクスポート
- 文書ウィンドウでのデータ表示の設定
- 文書定義のテスト
- 文書定義のローカライズ
- 分類
- フィールド抽出トレーニング
- 設定されたプロジェクトの操作
-
インボイス用のABBYY FlexiCapture
- インボイス用のABBYY FlexiCapture の機能
- インボイスをキャプチャする方法
- インボイスキャプチャプロジェクトを設定する方法
- 仕様
- Capturing receipts
- Capturing purchase orders
- Using NLP to process unstructured documents
- ABBYY FlexiCapture インターフェイス
-
付録
-
ABBYY FlexiCapture でのスクリプトの使用
- .Net 言語で書かれるスクリプトの仕様
- 外部アセンブリ
- オブジェクトモデル
-
処理ステージのカスタマイズのためのスクリプト
- スクリプトの種類
-
オブジェクト
- IActionResult
- IAssemblingError
- IAssemblingErrors
- IBatch
- IBatchCheckResults
- IBatchItem
- IBatchItems
- IBatchTypeClassifier
- IBatchTypeClassifierResult
- IBinarizationParams
- IBoxedBoolean
- ICharacterParams
- ICharactersParams
- ICheckmarkGroupValue
- ICheckmarkValue
- IDataSet
- IDataSetQuery
- IDataSetRecord
- IDocument
- IDocuments
- IDocumentExportResults
- IDocumentsExportResults
- IDocumentDefinitionInfo
- IDocumentDefinitionInfoArray
- IEditablePictureObject
- IExportFieldsToRedact
- IExportImageSavingOptions
- IField
- IFieldRegion
- IFieldRegions
- IFields
- IFlexiCaptureTools
- ILocalContrastParams
- IMatchedSectionInfo
- IMatchingInfo
- IPage
- IPageClassificationResult
- IPages
- IPictureObject
- IPictureObjectsInfo
- IPrincipal
- IPrincipals
- IProcessingCallback
- IProject
- IProperties
- IProperty
- IPropertyModificationInfo
- IRecordCheckResult
- IRecordset
- IRect
- IRects
- IRoutingRuleResult
- IRuleContext
- IRuleError
- IRuleErrors
- IRuleTag
- IRuleTags
- IScriptBinaryAttributes
- IScriptDefinitionContext
- ISectionDefinitionInfo
- ISectionDefinitionInfoArray
- IShadowsHighlightsParams
- IStageInfo
- IUserAttachment
- IUserAttachments
- IUserSessionInfo
- IValue
- IVARIANTArray
- TAssemlingErrorType
- TBatchItemType
- TColorToFilter
- TExportFieldType
- TExportType
- TImageCompressionType
- TPageClassificationType
- TPdfAVersion
- TPdfDocumentInfoType
- TPdfTextSearchAreaType
- TPrincipalType
- TProcessingPriority
- TPropertyType
- TRuleErrorType
- TStateType
- サンプルスクリプト
- 認識言語の内部名
-
インターフェイスイベントの処理スクリプト
- イベントハンドラ
-
オブジェクト
- IBoolean
- IBoxedFieldControl
- IDocumentEditor
- IDocumentItem
- IDocumentItems
- IDocumentsCollection
- IDocumentsWindow
- IDrawContext
- IErrorControl
- IErrorControls
- IErrorsWindow
- IFieldControl
- IFieldRegionControl
- IFieldRegionControls
- IFormWindow
- IImageWindow
- IMainMenu
- IMainWindow
- IMenu
- IMenuItem
- IPageControl
- IPageItem
- IPageItems
- IPagesCollection
- IPoint
- ISelection
- IShellRational
- IShellRect
- IShellRects
- ITaskWindow
- ITextEditor
- IToolbar
- IToolbarButton
- IToolbars
- TCommandBarType
- TCommandID
- TDockingType
- TDocumentState
- TErrorType
- TSelectionType
- TTaskWindowMode
- TTextSize
- TUserRole
- TWorkWindowType
- ウェブ検証ステーションのユーザースクリプト
- 機械による読み取りが可能なフォームの作成
- ホットキー
- 追加オプション
- 処理サーバーコマンドの説明
- FlexiCaptureバックアップ
- ABBYY FlexiCapture サンプルプロジェクト
- サポートされる認識言語
- Supported classifier languages
- 正しい文字レンダリングのためのフォント
- サポートされるテキストタイプ
- サポートされるバーコードタイプ
- 対応している入力形式
- PDF ファイルの処理
- 出力ファイル形式
- 日付形式
- 正規表現で使用されるアルファベット
- 特許
- サードパーティ技術
- 用語集
- テクニカル サポート
- ABBYY FlexiCapture の購入方法
- エンドユーザー使用許諾契約(EULA)
-
ABBYY FlexiCapture でのスクリプトの使用
Japanese (日本語) - Change language
画像の前処理オプション
画像はバッチに追加時に事前処理されます。具体的にいうと、文書間での分散、ノイズ除去、回転が行われます。必要に応じて、自動トリミング、カラーマークの削除など、より複雑な事前処理も設定可能です。低品質の画像の場合、特別な画像強調プロファイルを使用できます。
文書写真(モバイル機器からの撮影を含む)の処理中に起こる恐れのあるエラーや、認識やデータ抽出を妨げる複雑な背景(例:証明書、パスポートなど)の文書スキャンを補正するために、画像は編集されます。この段階では、低品質画像の認識結果の品質を強化できます。
次のタブにある事前処理オプションを選択してください:画像処理タブをクリックします。事前処理オプションは次の目的で選択できます:
- プロジェクト。
この場合、新しい画像が手動でプロジェクトバッチに追加されると、選択されたオプションが既定で使用されます。次を選択:プロジェクト→プロジェクトプロパティ...メインウィンドウで、画像処理タブをクリックします。 - インポートプロファイル。
これらのオプションは、このインポートプロファイルを使用して新しい画像を追加するときに使用されます。またインポートプロファイルの作成時に、画像の事前処理オプションを画像処理ステージ。 - 画像が自動で追加されます。
また画像の追加から、画像処理設定...ボタンを画像のロードダイアログボックスでクリックします。注:画像を手動でスキャンすると、画像の事前処理は行われません。スキャンされた画像は、インポートプロファイルが使用されている場合のみ事前処理されます。
- バッチタイプ。
この場合選択したオプションは、指定されたタイプのバッチから画像を処理するときに使用されます。バッチタイプを作成するときは、画像の事前処理オプションを次で選択します:画像処理タブをクリックします。バッチタイプに指定されたオプションは、次の場合にも適用されます: - スキャンステーションかウェブスキャンステーションから受け取った画像で、対応するステーションの文書にアセンブリされていない場合。画像処理セクションで指定されたオプションは、受け取った画像に適用されます。文書にアセンブリされているかは関係しません。
- ウェブサービスAPIメソッドで追加された画像(ExcludeFromAutomaticAssemblingフラグがfalseに設定されている場合)。詳細については、ウェブサービス APIヘルプファイルを参照してください。
- ホットフォルダから追加された画像(バッチタイプから画像処理オプションを使用オプションが選択されている場合)。詳しくは、画像インポートプロファイルをご覧ください。
- ファイルから手動で追加した画像。この場合、バッチタイプに指定したオプションを既定で使用します。
ユーザーは、次の画像の事前処理オプションのいずれかを選択できます:
- 空白ページの削除。空白ページをスキップして処理する場合は、このオプションにマークを付けます。
- 文書に画像を追加する原則を決定するオプション:
- 文書定義の適用時に自動的マッチング中(認識中)に画像を文書へ分割したい場合は、このオプションを選択します。この場合、画像が追加されてもすぐには文書へ分割されません。適切な文書定義に記載されている構造に基づいてページが分析・認識された後に、文書がアセンブリされます。詳しくは以下を参照してください:複数ページの文書定義の作成とページから文書へのアセンブリ。
- 1画像ファイル毎このオプションを選択すると、ファイルごとに新しい文書が作成されます(画像ファイルには複数のページを含めることができます)。
- 次の方法で画像を分離プログラムが区切りシートに到達すると、新しい文書が作成されます。空白ページを分類子として使用するには、ドロップダウンリストから空白ページを選択します。空白ページの検出ダイアログボックスで、検出される空白ページに基づいてパラメータを指定します。バーコード付きのページを分類子として使用するには、ドロップダウンリストからバーコード付きのページを選択します。設定...ボタンをクリックして、追加パラメーターを設定することができます。バーコードの値を指定する場合、文書分類子がその値に変更されるということに注意してください。バッチに区切りページを追加する必要がない場合は、セパレーターページを削除を選択してください。このオプションを選択しないと、区切りページがバッチに追加され、各文書の最初のページになります。
注:区切りページを使用してページを文書に分割する必要はありません。区切りページが絶対必要なケースが1つあります。ページの外観によって、前の文書に属するのか次の文書に属するのかを判断することが不可能な場合です。例えば、文書に数枚ほど同じページが含まれる場合や、そういった文書がバッチに複数含まれる場合に発生します。
注:スキャンステーションでスキャンや追加された文書の場合、バッチタイプの設定でスキャンステーションでバッチと文書の分離オプションが指定されています。
- 着信画像を処理するオプション:
- 基本的な画像処理。画像に基本的な変更を加える。複雑な処理を必要としない許容品質の画像に、このオプションを使用することを推奨します。
設定
全般
- 画像を回転
指定された方向に画像を回転します。 - カラーおよびグレー画像をモノクロに変換
イメージを白黒に変換します。 - 斑点除去
画像からノイズを除去します。注:画像のソーステキストにとても軽いか薄いタイプを含む場合か、ノイズ除去対象のサイズがユーザーに設定されている場合、次の時に区切り記号や薄い文字エレメントなど重要なエレメントが削除されないようにしてください:斑点除去関数が有効なとき。
- すべてのカラーマークを削除する
画像からカラーマークを全て削除します。
写真に関する推奨
このオプションは、文書の写真をインポートするときに使用することを推奨します。- 写真の解像度を補正する
写真に最適な解像度を自動で選択します。 - 自動切り取り
プログラムは自動で画像上のページ境界線を検出後、抽出するデータを含むフィールドをトリミングして、歪みとねじれを補正します。 - ISO ノイズを低減する
画像上のデジタルノイズを低減します。 - 背景を白くする
画像の背景を白くします。
歪み補正 (スキャンのみに適用されます)
既定ではこのオプションが選択されて、プログラムが新たに追加された画像の歪みを補正します。補正は黒四角や縦と横の区切り文字、テキストに基づいて実施します。歪み補正が正しく行われない場合を除き、歪み補正オプションをオフにしないことを推奨します(正しく行われない例:プログラムがスタンプやグラフを区切りと解釈して、間違ったデータに基づき画像の歪み修正する場合)。- 黒いセパレータで歪みを補正
このオプションを選択すると、区切りラインに基づいて画像の歪みを補正します。 - 黒四角を使用して傾斜を修正
このオプションを選択すると、黒四角に基づいて画像の歪みを補正します。 - テキストを使用して傾斜を修正
このオプションを選択すると、画像のテキストに基づいて画像の歪みを補正します。
- 画像を回転
- 画像補正プロファイルを使用する。特別な画像強調プロファイルを使用する。このオプションはより複雑な編集機器を必要として、同じ流れや色々混ざった流れで供給する特定の画像への使用を推奨します。
画像が混在している写真を処理して、基本ツールと異なる一連のツールが必要な場合は、写真の特別プロファイルを使用するオプションをマークして、2番目のプロファイルを選択してください - 処理中に元の画像を保存する。このオプションを使用すると、元の画像をファイルストレージに保存できます。このオプションを使用すると、自動処理後に重要なデータが削除された場合に元の画像へ戻ることができます。
注:元の画像を保存すると、プロジェクトが占めるスペースが増えて、処理速度が遅くなります。そのため元の画像に戻す必要があるときだけ、このオプションを有効にすることを推奨します。
- PDF処理オプション:
- 自動(FlexiCaptureがPDFテキストレイヤーかOCRかを選択)―オプションの処理タイプは、可用性およびテキスト層の質に応じて自動選択されます。
- 可能な限りPDFテキストレイヤーを使用―使用可能な場合、テキスト層のテキストが使用されます。
- OCRのみを使用―OCRは、テキスト層をもつものも含め、すべての文書に実行されます。
- オフィス形式ファイルの前処理オプション。ビルトインの変換モジュールまたはサードパーティーのソフトウェアを使用して、インポートされた文書画像ファイルの処理に加えて、オフィス形式でインポートされた文書をPDFに変換することができます。
PDFへの変換にサードパーティー製ソフトウェアを使用するには、下記のオプションのいずれかまたは両方を選択します: - LibreOffice® の使用を許可する(LibreOffice 4.2、4.3、4.4、および5をサポートしています)
- Microsoft® Office の使用を許可する(Microsoft Office 2010、2013、および2016をサポートしています)
文書画像とオフィスファイルを同時にインポートできます(詳細についてはサポート対象の入力フォーマットを参照してください)。
- メールからインポートすると、メッセージ本文を文書として使用出できます。
- オフィスファイル前処理オプションを両方選択している場合、ABBYY FlexiCapture は、最も適切なオフィスアプリケーションを自動的に選択します。選択したアプリケーションはそれぞれのタスクログに表示されます。
- サードパーティアプリケーションを使用したPDFへの変換は、文書のインポートに使用する処理ステーションに、各アプリケーションがインストールされている場合にのみ機能します。
- Officeファイルの変換でMicrosoft Officeを使用する場合:
- Microsoft Officeのコピーを有効にする必要があります。
- 管理者として実行しなければいけません(認証... ボタンをクリックして、認証設定ダイアログボックスを開きます)。
1/14/2021 2:17:22 PM