画像の前処理オプション
画像はバッチに追加時に事前処理されます。具体的にいうと、文書間での分散、ノイズ除去、回転が行われます。必要に応じて、自動トリミング、カラーマークの削除など、より複雑な事前処理も設定可能です。低品質の画像の場合、特別な画像強調プロファイルを使用できます。
文書写真(モバイル機器からの撮影を含む)の処理中に起こる恐れのあるエラーや、認識やデータ抽出を妨げる複雑な背景(例:証明書、パスポートなど)の文書スキャンを補正するために、画像は編集されます。この段階では、低品質画像の認識結果の品質を強化できます。
次のタブにある事前処理オプションを選択してください:画像処理タブをクリックします。事前処理オプションは次の目的で選択できます:
- プロジェクト。
この場合、新しい画像が手動でプロジェクトバッチに追加されると、選択されたオプションが既定で使用されます。次を選択:プロジェクト→プロジェクトプロパティ...メインウィンドウで、画像処理タブをクリックします。 - インポートプロファイル。
これらのオプションは、このインポートプロファイルを使用して新しい画像を追加するときに使用されます。またインポートプロファイルの作成時に、画像の事前処理オプションを画像処理ステージ。 - 画像が自動で追加されます。
また画像の追加から、画像処理設定...ボタンを画像のロードダイアログボックスでクリックします。
注:画像を手動でスキャンすると、画像の事前処理は行われません。スキャンされた画像は、インポートプロファイルが使用されている場合のみ事前処理されます。 - バッチタイプ。
この場合選択したオプションは、指定されたタイプのバッチから画像を処理するときに使用されます。バッチタイプを作成するときは、画像の事前処理オプションを次で選択します:画像処理タブをクリックします。バッチタイプに指定されたオプションは、次の場合にも適用されます: - スキャンステーションかウェブスキャンステーションから受け取った画像で、対応するステーションの文書にアセンブリされていない場合。画像処理セクションで指定されたオプションは、受け取った画像に適用されます。文書にアセンブリされているかは関係しません。
- ウェブサービスAPIメソッドで追加された画像(ExcludeFromAutomaticAssemblingフラグがfalseに設定されている場合)。詳細については、ウェブサービス APIヘルプファイルを参照してください。
- ホットフォルダから追加された画像(バッチタイプから画像処理オプションを使用オプションが選択されている場合)。詳しくは、画像インポートプロファイルをご覧ください。
- ファイルから手動で追加した画像。この場合、バッチタイプに指定したオプションを既定で使用します。
ユーザーは、次の画像の事前処理オプションのいずれかを選択できます:
- 空白ページの削除。空白ページをスキップして処理する場合は、このオプションにマークを付けます。
- 文書に画像を追加する原則を決定するオプション:
- 文書定義の適用時に自動的マッチング中(認識中)に画像を文書へ分割したい場合は、このオプションを選択します。この場合、画像が追加されてもすぐには文書へ分割されません。適切な文書定義に記載されている構造に基づいてページが分析・認識された後に、文書がアセンブリされます。詳しくは以下を参照してください:複数ページの文書定義の作成とページから文書へのアセンブリ。
- 1画像ファイル毎このオプションを選択すると、ファイルごとに新しい文書が作成されます(画像ファイルには複数のページを含めることができます)。
- 次の方法で画像を分離プログラムが区切りシートに到達すると、新しい文書が作成されます。空白ページを分類子として使用するには、ドロップダウンリストから空白ページを選択します。空白ページの検出ダイアログボックスで、検出される空白ページに基づいてパラメータを指定します。バーコード付きのページを分類子として使用するには、ドロップダウンリストからバーコード付きのページを選択します。設定...ボタンをクリックして、追加パラメーターを設定することができます。バーコードの値を指定する場合、文書分類子がその値に変更されるということに注意してください。バッチに区切りページを追加する必要がない場合は、セパレーターページを削除を選択してください。このオプションを選択しないと、区切りページがバッチに追加され、各文書の最初のページになります。
注:区切りページを使用してページを文書に分割する必要はありません。区切りページが絶対必要なケースが1つあります。ページの外観によって、前の文書に属するのか次の文書に属するのかを判断することが不可能な場合です。例えば、文書に数枚ほど同じページが含まれる場合や、そういった文書がバッチに複数含まれる場合に発生します。
注:スキャンステーションでスキャンや追加された文書の場合、バッチタイプの設定でスキャンステーションでバッチと文書の分離オプションが指定されています。 - 着信画像を処理するオプション:
- 基本的な画像処理。画像に基本的な変更を加える。複雑な処理を必要としない許容品質の画像に、このオプションを使用することを推奨します。
設定
- 画像補正プロファイルを使用する。特別な画像強調プロファイルを使用する。このオプションはより複雑な編集機器を必要として、同じ流れや色々混ざった流れで供給する特定の画像への使用を推奨します。
画像が混在している写真を処理して、基本ツールと異なる一連のツールが必要な場合は、写真の特別プロファイルを使用するオプションをマークして、2番目のプロファイルを選択してください - 処理中に元の画像を保存する。このオプションを使用すると、元の画像をファイルストレージに保存できます。このオプションを使用すると、自動処理後に重要なデータが削除された場合に元の画像へ戻ることができます。
注:元の画像を保存すると、プロジェクトが占めるスペースが増えて、処理速度が遅くなります。そのため、このオプションを有効にするのは、本当に元の画像に戻す必要がある場合に限ることをお勧めします。例えば、前処理オプションで画像の切り取りやスタンプの除去などの機能が有効になっている場合などです。 - PDF処理オプション:
- 自動(FlexiCaptureがPDFテキストレイヤーかOCRかを選択)―オプションの処理タイプは、可用性およびテキスト層の質に応じて自動選択されます。
- 可能な限りPDFテキストレイヤーを使用―使用可能な場合、テキスト層のテキストが使用されます。
- OCRのみを使用―OCRは、テキスト層をもつものも含め、すべての文書に実行されます。
- オフィス形式ファイルの前処理オプション。ビルトインの変換モジュールまたはサードパーティーのソフトウェアを使用して、インポートされた文書画像ファイルの処理に加えて、オフィス形式でインポートされた文書をPDFに変換することができます。
PDFへの変換にサードパーティー製ソフトウェアを使用するには、下記のオプションのいずれかまたは両方を選択します: - LibreOffice® の使用を許可する(LibreOffice 4.2、4.3、4.4、および5をサポートしています)
- Microsoft® Office の使用を許可する(Microsoft Office 2010、2013、2016、および2019をサポートしています)
文書画像とオフィスファイルを同時にインポートできます(詳細についてはサポート対象の入力フォーマットを参照してください)。
- メールからインポートすると、メッセージ本文を文書として使用出できます。
- オフィスファイル前処理オプションを両方選択している場合、ABBYY FlexiCapture は、最も適切なオフィスアプリケーションを自動的に選択します。選択したアプリケーションはそれぞれのタスクログに表示されます。
- サードパーティアプリケーションを使用したPDFへの変換は、文書のインポートに使用する処理ステーションに、各アプリケーションがインストールされている場合にのみ機能します。
- Officeファイルの変換でMicrosoft Officeを使用する場合:
- Microsoft Officeのコピーを有効にする必要があります。
- 管理者として実行しなければいけません(認証... ボタンをクリックして、認証設定ダイアログボックスを開きます)。
12.04.2024 18:16:06