OCR前に考慮すべき文書の機能

画像の品質は、OCR の精度に大きな影響を与えます。 このセクションでは画像の認識を実行する前に考慮すべき要因について説明します。

OCR言語

ABBYY FineReaderは単一および複数の言語から成る文書を認識できます(例:2つ以上の言語で書かれたもの)。 多言語の文書については、複数のOCR言語を選択する必要があります。

OCR言語を選択するには、次のようにクリックします: オプション >  言語 その後、以下のオプションのいずれかを選択します:

  • 以下のリストから自動でOCR言語を選択
    ABBYY FineReaderは自動でユーザー定義の言語リストから適切な言語を選択します。 言語リストを編集する:
    1. 以下のリストから自動でOCR言語を選択 オプションが選択されていることを確認します。
    2. 指定... ボタンをクリックします。
    3. オプションのグループの 言語 ダイアログボックスで、目的の言語を選択し、クリックします OK
    4. オプションのグループの オプション ダイアログボックスで OKをクリックします。
  • OCR 言語を手動で指定
    必要な言語がリストにない場合には、このオプションを選択します。

以下のダイアログボックスで、1つまたは複数の言語を指定します。 特定の言語の組み合わせを頻繁に使用する場合には それらの言語のために 新しいグループを作成できます。

言語がリストにない場合には、次のいずれかが原因です:

  1. ABBYY FineReaderによってサポートされない、または
    サポートされる言語の完全なリストは、以下を参照してください: サポートされる認識言語
  2. お使いのバージョンの製品でサポートされていない。
    お使いの製品バージョンで利用可能な言語の完全なリストは以下で参照できます: ライセンスダイアログボックス (このダイアログボックスは、 ヘルプ > バージョン情報 > ライセンス情報 とクリックすると開きます)。

ビルトインの言語および言語グループを使用するほかに、独自の言語およびグループを作成できます。以下も参照してください: プログラムが特定の文字を認識できない場合

印刷タイプ

タイプライターやFAXなど様々 なデバイスを使用して文書を印刷することがあります。 OCRの精度は文書の印刷方法によって異なります。 ダイアログボックスで正しい印刷タイプを選択することで、OCRの品質を改善できます。 オプション ダイアログボックスを開きます。

ほとんどの文書で、プログラムは印刷タイプを自動で検出します。 自動で印刷タイプを検出するには 自動 オプションが ドキュメント タイプ ダイアログボックスのオプションのグループで選択されている必要があります。 オプション (このダイアログボックスは、ツール > オプション... > OCR これらのオプションにアクセスするには、次のようにクリックします: フルカラーまたは白黒モードの文書を処理できます。

必要な場合には、印刷タイプを手動で選択できます。

タイプライターで打ったテキストの例です。 すべての文字が同じ幅です ("w"や"t"などを比較します)。 このタイプのテキストは、を選択します タイプライター
FAXによって作成されたテキストの例です。 例からわかるように、一部の場所では文字が明瞭ではありません。 ノイズや歪みがあります。 このタイプのテキストは、を選択します FAX

タイプライターで打ったテキストまたはFAXを認識した後、 自動 通常の印刷された文書を処理する前に、を選択してください。

印刷品質

「ノイズ」(ランダムな黒い点や斑点)、ぼやけ、凹凸の文字や傾斜した行や表の罫線が歪んでいる質の悪い文書は、特定のスキャン設定が必要となる場合があります。

FAX 新聞

粗悪な品質の文書は グレースケールでスキャンするのが最適です。 グレースケールでスキャンする際、プログラムは最適な 明度(明るさ) の値を自動で選択します。

グレースケールスキャンモードはスキャンされたテキストの文字に関する情報をより多く保持し、平均または平均より悪い品質の文書の認識時に、より良いOCR結果が達成されるようにします。 画像エディターで利用できる画像編集ツールを使用して手動で欠陥を修正することもできます。 以下も参照してください: 文書画像に不具合が多く、OCRの精度が低い場合

カラーモード

フルカラー文書の元の色を維持する必要がない場合には、白黒モードで文書を処理できます。 これにより結果として生成されるOCRプロジェクトのサイズが大幅に削減され、OCRプロセスは迅速になります。 しかし、白黒の低いコントラストの画像を処理することで、粗悪なOCR品質になる可能性があります。 写真、雑誌のページ、また、中国語、日本語、韓国語のテキストについては白黒変換は推奨されません。

ヒント。 ダイアログボックスのタブで以下を選択してカラー文書および白黒文書の処理を早めることができます。 高速認識 OCR ダイアログボックスの オプション ダイアログボックスを開きます。 認識モードの詳細については以下を参照してください: OCRオプション

適切なカラーモードの選択に関する追加の推奨事項については、以下を参照してください: スキャンのヒント

文書が白黒に変換されたら、カラーに戻すことはできません。 カラー文書を取得kするには、カラー画像のあるファイルを開くか、紙の文書をカラーモードでスキャンします。

11/2/2018 4:19:30 PM


Please leave your feedback about this article