[2. プロセス]ワークフロープロパティのダイアログボックスのタブ

2. プロセスタブには、認識オプションが含まれています。

オプション名 オプションの説明
ドキュメント言語 認識言語を指定します。言語はアルファベット順にソートされ、二つのグループに分けられます:一つのグループは辞書サポート付きの言語であり、もう一つのグループは辞書サポート無しの言語です。認識言語のリストを参照してください。
自動で言語を選択

ドキュメントの言語は ドキュメント言語リスト で選択した言語を使って自動的に検出されます。

注:このオプションを選択すると、非ヨーロッパ言語のテキストを処理する際にABBYY FineReaderサーバーが遅くなる可能性があります。

OCRの最適化 認識の品質、または速度を最適化するためのモードを指定します。
カスタム辞書の使用 認識中に使用されるカスタム辞書へのパスを指定します。カスタム辞書は UTF-16 符号化形式のテキストファイルであり、単語はすべてリストとして表され、各行には一つの単語が含まれています。
処理モード

認識モードを指定します:

  • 全テキスト(写真からテキストを抽出)


    プログラムは、画像領域のテキストを含め、ドキュメント内で見つかったすべてのテキストを認識します。
  • テキストと写真(写真からテキストを抽出しない)
    プログラムは、画像領域内のテキストを除いて、すべてのテキストを認識します。
  • バーコードのみ
    ドキュメントからバーコードの値だけを抽出する場合は、このモードを選択します。
    • 注:このオプションを使用すると、バーコード無しのページは空白として扱われます。
    • 注: 星印なしの Code 39 のタイプのバーコードは、 このモードでは認識できません。

詳細設定...

(ボタン)

高度な処理設定ダイアログボックスを開きます。
PDF処理モード
  • 自動
    入力 PDF ドキュメントが分析され、(i) テキストレイヤーのないドキュメントおよびスキャン、または認識されたテキストのあるドキュメントは OCR の対象になります。(ii) Office ファイルから取得したテキストレイヤーがあるドキュメントは、「そのまま」エクスポートされます。
  • 常にOCRを使用
    入力 PDF ドキュメントは、テキストレイヤーの有無にかかわらず OCR の対象となります。
  • PDFファイルで常にテキストを使用
    テキストレイヤーのない入力 PDF ドキュメントは OCR の対象になります。テキストレイヤーがあるドキュメントは、「そのまま」エクスポートされます。
元の写真とコメントをスキャンPDFでも維持する

元の画像レイヤー、メモ、コメントは出力ファイルに保存されます。

注:元の画像レイヤーはJPEGファイルとしてのみ保存できます。

電子署名付きのPDFファイルを変更しない PDF ドキュメントのテキストは OCR の対象となりますが、元のドキュメントはそのまま残り、デジタル署名は保持されます。
Office文書処理モード ドロップダウンリストから、Office ドキュメントの処理で使用する Microsoft Office または LibreOffice アプリケーションを選択します (例: *.doc, *.docx, *.odt, *.html, *.htm, *.txt, *.rtf; *.xls, *.xlsx, *.ods; *.ppt, *.pptx, *.odp ファイル)。

こちらも参照してください:

ワークフローのプロパティダイアログボックス

29.11.2022 17:26:48

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.