OCR の前に検討すべき文書の特性

画像の品質は認識品質に大きく影響します。このセクションでは、画像を認識する前に考慮すべき要素について説明します。

文書の言語

ABBYY FineReader では、単一言語と多言語 (2 つ以上の言語で書かれている場合など) の両方の文書を認識できます。多言語の文書の場合は、複数の認識言語を選択する必要があります。

文書の OCR 言語を指定するには、メイン ツールバーの [文書の言語] ドロップダウン リスト、または [タスク] ウィンドウで次のうち 1 つを選択します。

  • 自動選択

ユーザー定義の言語リストから適切な言語が自動的に選択されます。このリストに変更を加えるには

  1. [その他の言語…] を選択します。
  2. [言語エディタ] ダイアログ ボックスで、[次の一覧からドキュメントの言語を自動選択します] オプションを選択します。
  3. [指定…] ボタンをクリックします。
  4. [ 言語] ダイアログ ボックスで、必要な言語を選択します。
  • 1 つの言語または言語の組み合わせ

1 つの言語または言語の組み合わせを選択します。言語のリストには、最近使用した認識言語のほか、英語、ドイツ語、フランス語が含まれています。

  • その他の言語…

必要な言語がリストに見当たらない場合は、このオプションを選択します。

[言語エディタ] ダイアログ ボックスで、[言語を手動で指定する] オプションを選択し、必要な言語のボックスにチェックを付けて、その言語を選択します。特定の言語の組み合わせを頻繁に使用する場合は、その言語の新しいグループを作成できます。

言語がリストに含まれていない場合は次のいずれかが考えられます。

  1. その言語は、ABBYY FineReader ではサポートされていません。

サポートされているすべての言語のリストについては、「サポートされている言語」を参照してください。

  1. その言語は、ご使用のソフトウェアではサポートされていません。

ご使用の製品で利用可能なすべての言語のリストは、[ライセンス] ダイアログ ボックス ([ヘルプ] > [バージョン情報… ] > [ライセンス情報]) に記載されています。

組み込まれている言語および言語グループに加えて、独自の言語を作成できます。詳細については、「一部の文字をプログラムが認識できなかった場合」を参照してください。

印刷タイプ

文書はタイプライターや FAX 機などのさまざまな機器で印刷されることがあります。OCR 品質は [オプション] ダイアログ ボックスで正しい [ドキュメント タイプ] を選択することにより高めることができます。

ほとんどの文書の場合、印刷タイプはプログラムによって自動的に検出されます。印刷タイプの自動検出を行うには、[オプション] ダイアログ ボックスの [ドキュメント タイプ] の項目で [自動] オプションを選択する必要があります ([ツール] > [オプション…])。文書は、フルカラーまたはモノクロのモードで処理できます。

また、必要に応じて手動で印刷タイプを選択することもできます。

タイプライターで書かれたテキストの例です。文字の幅がすべて等しくなっています (例えば、「w」と「t」を比較してください)。この種のテキストの場合は、[タイプライター (モノクロ モードのみ)] を選択します。
FAX 機で作成されたテキストの例です。この例に見られるように、ノイズと歪みに加えて、場所によっては文字が不鮮明です。この種のテキストの場合は、[FAX (モノクロ モードのみ)] を選択します。

ヒント:タイプライターで作成されたテキストまたは FAX を認識した後、通常の印刷物を処理する前に、必ず [自動] を選択してください。

印刷品質

「ノイズ」 (すなわち、不均一な黒い点や斑点)、ぼやけてむらのある文字、傾いた行や表の罫線のある低品質の文書は、特定のスキャン設定が必要な場合があります。

FAX 新聞

低品質の文書は、グレースケールでスキャンするのが最善です。グレースケールでスキャンする場合、プログラムにより最適な明るさの値が自動的に選択されます。

グレースケールのスキャン モードでは、品質が中レベルから低レベルの文書を認識する場合の OCR 結果を高めるために、スキャンするテキストの文字についてより多くの情報を保持します。また、画像エディタで利用可能な画像編集ツールを使用して、一部の欠陥を手動で修正することもできます。詳細については、「画像の予備処理」を参照してください。

カラー モード

フルカラーの文書の元の色を保持する必要がない場合は、文書をモノクロ モードで処理できます。これにより、処理によって作成される ABBYY FineReader 文書のサイズが大幅に小さくなり、OCR 処理も高速になります。ただし、コントラストの低い画像をモノクロで処理すると、OCR 品質が低くなることがあります。また、写真、雑誌のページ、および中国語、日本語、韓国語のテキストの場合は、モノクロ処理をお勧めしません。

注意:[高速読み取り] オプション ([オプション] ダイアログ ボックスの [読み取り] タブにあります) を選択し、カラーおよびモノクロの文書の認識を高速化することもできます。認識モードについての詳細は、「OCR オプション」を参照してください。

カラー モードを選択するには

  • [タスク] ダイアログ ボックスの [カラー モード] ドロップダウン リストを使用するか、または
  • [オプション] ダイアログ ボックス ([ツール] > [オプション…]) の [ドキュメント] タブにある [カラー モード] のオプションのうち 1 つを選択します。

重要事項 文書をモノクロに変換した後で、色を復元することはできません。カラーの文書を取得するには、カラー画像を含むファイルを開くか、または紙文書をカラー モードでスキャンします。

1/14/2020 5:26:20 PM


Please leave your feedback about this article