一部の文字をプログラムが認識できなかった場合

ABBYY FineReader はテキストを認識する際に文書の言語に関するデータを使用します。文書に含まれている文字の中で一般的ではない要素 (コード番号など) を持つものは、文書の言語にそれらの文字が含まれていない可能性があるため、プログラムで認識できないことがあります。このような文書を認識するために、必要な文字をすべて含むカスタム言語を作成できます。また、複数言語を言語グループに割り当てて、そのグループを認識に使用することもできます。

ユーザー言語の作成

  1. [ツール] メニューで [言語エディタ…] をクリックします。
  2. [言語エディタ] ダイアログ ボックスで、[新規…] をクリックします。
  3. 表示されたダイアログ ボックスで、[既存の言語に基づいて新しい言語を作成する] オプションを選択し、新しい言語の基礎となる言語を選択してから [OK] をクリックします。
  4. [言語のプロパティ] ダイアログ ボックスが開きます。このダイアログ ボックスで
    1. 新しい言語の名前を入力します。
    2. 以前選択した基本言語が [ソース言語] ドロップダウン リストに表示されます。ソース言語は変更できます。
    3. アルファベット には基本言語の英文字が含まれています。英文字を編集する場合は ボタンをクリックします。
    4. テキストを認識してその結果を確認する際にプログラムが使用する辞書に関して、いくつかのオプションがあります。
      • なし

言語に辞書はありません。

  • 組み込み辞書

プログラムの組み込み辞書が使用されます。

  • ユーザー辞書

辞書の用語を指定する場合、または既存のカスタム辞書または Windows-1252 エンコーディング (用語はスペースまたはその他の英文字に含まれていない文字で区切られている必要があります) のテキスト ファイルをインポートする場合は [編集…] ボタンをクリックします。

注意:ユーザー辞書からの単語は、認識したテキストのスペル チェックの際に誤りとはマークされません。これらの単語はすべて大文字またはすべて小文字でつづることができ、最初の文字を大文字にすることもできます。

辞書にある単語 スペル チェックの際に誤りとみなされない単語
abc abc、Abc、ABC
Abc abc、Abc、ABC
ABC abc、Abc、ABC
aBc aBc、abc、Abc、ABC
  • 正規表現

正規表現を使用してカスタム言語の辞書を作成できます。

詳細については、「正規表現」を参照してください。

  1. 言語にはいくつかのプロパティを追加できます。これらのプロパティを変更するには、[詳細…] ボタンをクリックします。

[言語の詳細プロパティ] ダイアログ ボックスが開きます。ここでは次の項目を指定できます。

  • 単語の始めまたは終わりに使用できる文字
  • 単語とは別に表示される文字以外の記号
  • 単語の中で現れる可能性がある文字で無視すべき文字
  • この辞書を使用して認識されるテキストで現れることがない文字 (禁止文字)
  • 言語で認識可能なすべての文字
  • [テキストにアラビア数字、ローマ数字、略語が含まれている可能性がある] オプションを有効にすることもできます
  1. これで、文書の言語を選択する際に、新たに作成した言語を選択できます。

文書の言語の詳細については、「OCR の前に検討すべき文書の特性」を参照してください。

既定では、ユーザー言語は FineReader 文書フォルダに保存されます。また、すべてのユーザー言語およびユーザー パターンを 1 つのファイルに保存することもできます。これを行うには、[ツール] メニューで [オプション…] をクリックして [オプション] ダイアログ ボックスを開き、 [読み取り] タブをクリックして [ファイルに保存...] ボタンをクリックします。

言語グループの作成

特定の言語の組み合わせを定期的に使用する場合は、便宜のためにその言語をグループにまとめることができます。

  1. [ツール] メニューで [言語エディタ…] をクリックします。
  2. [言語エディタ] ダイアログ ボックスで、[新規…] をクリックします。
  3. [新しい言語またはグループ] ダイアログ ボックスで、[新しい言語グループを作成する] を選択し、[OK] をクリックします。
  4. [言語グループのプロパティ] ダイアログ ボックスで、新しいグループの名前を入力し、必要な言語を選択します。

注意:テキストに特定の文字が含まれていないことが分かっている場合は、それらの文字を禁止文字として明確に指定できます。禁止文字を指定することにより、認識の速度と品質を高めることができます。禁止文字を指定するには、[言語グループのプロパティ] ダイアログ ボックスで [詳細…] ボタンをクリックします。[言語グループの詳細プロパティ] ダイアログ ボックスで、[禁止文字] フィールドに禁止文字を入力します。

  1. [OK] をクリックします。

新たに作成したグループが、メイン ツールバーの [ドキュメントの言語] ドロップダウン リストに追加されます。

既定では、ユーザー言語グループは FineReader 文書フォルダに保存されます。また、すべてのユーザー言語およびユーザー パターンを 1 つのファイルに保存することもできます。これを行うには、[ツール] メニューで [オプション…] をクリックして [オプション] ダイアログ ボックスを開き、 [読み取り] タブをクリックして [ファイルに保存…] ボタンをクリックします。

ヒント:ある文書のために特定の言語の組み合わせが必要な場合は、その言語のグループを作成せずに、必要な言語を直接選択することもできます。

  1. [ドキュメントの言語] ドロップダウン リストで、[その他の言語…] を選択します。
  2. [言語エディタ] ダイアログ ボックスで、[言語を手動で指定する] を選択します。
  3. 必要な言語を選択し、[キャンセル] をクリックします。

1/14/2020 5:26:20 PM


Please leave your feedback about this article