OCRオプション

早く正確なOCR結果を取得したい場合には、正しいOCRオプションを選択することが重要です。 どのオプションを使用するかを決定する際には、文書のタイプと複雑さだけでなく、結果の文書の意図される用途についても考慮されるべきです。 以下のオプションのグループが利用可能です:

OCRオプションは OCR ダイアログボックスの オプション (このダイアログボックスは、 ツール > オプション... とクリックすると開きます)。

ABBYY FineReaderはOCRプロジェクトに追加したページをすべて自動で認識します。 現在選択されているオプションがOCRに使用されます。 新たに追加した画像の自動分析および自動 OCR は、画像処理 ダイアログボックスの オプション (このダイアログボックスは、 ツール > オプション... とクリックすると開きます)。

文書の認識語にOCRオプションを変更する場合、OCR処理を再度実行して新しいオプションで文書が認識されるようにします。

PDF認識モード

これらの設定はテキストレイヤーと写真のあるPDF文書での使用が意図されています。 そうしたPDF文書は通常、編集可能な書式の文書から作成されます。 検索可能なPDFや画像のみのPDFなどの、その他の種類のPDF文書は常に、こうしたPDFの種類では、デフォルトの設定になっている OCRの使用 モードで処理されます。 それらのPDFを処理するために、追加の設定は必要ありません。

3種類の認識モードが利用可能です:

  • OCRかPDFのテキストかを自動選択
    プログラムはテキストレイヤーを精査して、既存のテキストレイヤーに品質の良いテキストが含まれる場合には、これを使用します。 そうでない場合には、OCRを使用して新しいテキストレイヤーが作成されます。
  • OCRの使用
    OCRを使用して新しいテキストレイヤーが作成されます。 このモードではより長く時間がかかりますが、粗悪な品質のテキストレイヤーの文書にはより適しています。
  • PDFからのテキストのみ使用
    これはテキストレイヤーのあるPDF文書のデフォルトモードです。 プログラムはOCRを実行せずに元のテキストレイヤーを使用します。

OCRスピードと正確性のバランス

ABBYY FineReader 14 を使用して以下を実行できます:

  • 徹底した認識
    このモードでは、ABBYY FineReader は単純な文書と、複雑なレイアウトの文書の両方の分析と認識を行います。これには、塗りつぶされた背景に印刷されたテキストが配置された文書や、複雑な表 (白い格子線のある表、カラーのセルのある表を含む) のある文書が含まれます。
    徹底した認識 より長い時間を要するもののより良い品質を達成する。
  • 高速認識
    このモードは、レイアウトがシンプルで、画像の品質が高く、サイズの大きな文書の処理に推奨されます。

印刷タイプ

文書の印刷に使用されたデバイスの種類を指定します。 以下も参照してください: OCR前に考慮すべき文書の機能

構造要素を検出する

構造要素を検出するプログラムを選択:ヘッダー、フッター、脚注、表の内容、リスト。 選択された要素は文書が保存された場合にクリック可能になります。

バーコード

文書にバーコードが含まれ、それを写真として保存するのではなく、それを文字列や数字に変換したい場合には、を選択します。 バ―コードを文字列に変換。 この機能はデフォルトではオフになっています。

パターンと言語

以下のテキストのタイプでは、学習機能を使用した認識が使用されます:

  • 特殊記号のあるテキスト(例:数学機能)
  • 装飾的な要素のあるテキスト
  • 粗悪な品質の画像から作成された大量のテキスト(100ページ以上)

学習機能 はデフォルトではオフになっています。 OCR実行中に 新しい文字や連結線の認識のために学習機能を使用 ABBYY FineReaderの学習機能を使用するには、をオンにしてください。

認識にはビルトインまたは独自のパターンを使用できます。

ユーザーパターンと言語の設定を保存、読み込みできます。 以下も参照してください: OCRプロジェクト

フォント

ここでは、認識されたテキストを保存する際に使用するフォントを選択できます。

フォントを選択する方法:

  1. フォントの選択... ボタンをクリックします。
  2. 目的のフォントを選択して、をクリックします。 OK

02.11.2018 16:19:30


Please leave your feedback about this article