複合文字の言語での作業

ABBYY FineReader ではアラビア語、ヘブライ語、イディッシュ語、タイ語、中国語、日本語、および韓国語の文書を認識できます。CJK と欧州言語の組み合わせが使用される中国語、日本語、または韓国語の文書で作業する場合、留意すべき追加的な検討事項がいくつかあります。

言語サポートのインストール

アラビア語、ヘブライ語、イディッシュ語、タイ語、中国語、日本語、韓国語で書かれたテキストを認識するためにはそれぞれの言語のインストールを必要とすることがあります。

Microsoft Windows 8、Windows 7、および Windows Vista では、既定によりこれらの言語をサポートしています。

Microsoft Windows XP で新しい言語をインストールするには

  1. タスクバー で [スタート] をクリックします。
  2. [コントロール パネル] > [地域と言語のオプション] をクリックします。
  3. [言語] タブをクリックし、以下のオプションを選択します。
    • 複合文字や右から左方向に書く言語 (タイ語を含む) のファイルをインストールする

アラビア語、ヘブライ語、イディッシュ語、およびタイ語のサポートを有効にします

  • 東アジア言語のファイルをインストールする

日本語、中国語、および韓国語のサポートを有効にします

  1. [OK] をクリックします。

推奨されるフォント

アラビア語、ヘブライ語、イディッシュ語、タイ語、中国語、日本語、および韓国語のテキストの認識は、Windows への追加フォントのインストールを必要とする場合があります。下記の表は、これらの言語のテキストに推奨されるフォントをまとめたものです。

OCR 言語 推奨されるフォント
アラビア語 Arial™ Unicode™ MS*
ヘブライ語 Arial™ Unicode™ MS*
イディッシュ語 Arial™ Unicode™ MS*
タイ語

Arial™ Unicode™ MS*

Aharoni

David

Levenim mt

Miriam

Narkisim

Rod

中国語 (簡体字)

中国語 (繁体字)

日本語、韓国語、

韓国語 (ハングル)

Arial™ Unicode™ MS*

SimSun フォント

例:SimSun (Founder Extended)、SimSun-18030、NSimSun

Simhei

YouYuan

PMingLiU

MingLiU

Ming(for-ISO10646)

STSong

* このフォントは、Microsoft Windows XP および Microsoft Office 2000 以降とともにインストールされます。

下記のセクションでは認識精度を高めるためのアドバイスが説明されています。

自動処理の無効化

既定では、ABBYY FineReader 文書に追加したページはすべて自動的に認識されます。

ただし、CJK 言語と欧州言語を組み合わせたテキストが文書に含まれている場合は、ページの向きの自動検出を無効にし、すべてのページ画像が正しい向きになっている (例えば、上下逆さまにスキャンされていない、など) 場合のみ、見開きページを分割するオプションを使用することをお勧めします。

[ページの向きを検出する] オプションと [見開きページを分割する] オプションは、[オプション] ダイアログ ボックスの [スキャン/開く] タブで有効または無効にできます。

注意:アラビア語、ヘブライ語、イディッシュ語のページを分割するには、必ず対応する認識言語を最初に選択し、その後で [見開きページを分割する] オプションを選択してください。これにより、ページが必ず正しい順序で並べられるようになります。また、[ブックのページを差し替える] オプションを選択して、元のページ番号に戻すこともできます。詳細については、「FineReader 文書とは何か」を参照してください。

文書の構造が複雑な場合は、画像の自動分析と自動 OCR を無効にし、これらの操作を手動で行うことをお勧めします。

自動分析と自動 OCR を無効にするには

  1. [オプション] ダイアログ ボックスを開きます ([ツール] > [オプション…])。
  2. [ページが追加されたら自動的に処理] のオプションを、[スキャン/開く] タブで解除します。
  3. [OK] をクリックします。

複数の言語で書かれた文書の認識

下記の説明では、英語と中国語のテキストを両方含む文書が例になっています。

  1. メイン ツールバーで、[ドキュメントの言語] ドロップダウン リストから [その他の言語…] を選択します。[言語エディタ] ダイアログ ボックスで [言語を手動で指定する] を選択し、言語リストから中国語と英語を選択します。
  2. 画像をスキャンするか、開きます。
  3. プログラムが画像上のすべてのエリアを検出できなかった場合
    • エリア編集ツールを使用して手動でエリアを指定します。
    • 1 つの言語のみを含むエリアを指定します。これを行うには、それらを選択し、[領域のプロパティ] ペインでそれぞれの言語を指定します。

重要事項 言語は同じ種類のエリアのみに指定できます。テキストなどの異なる種類のエリアを選択した場合、言語を指定することはできません。

  1. メイン ツールバーで [読み取り] ボタンをクリックします。

非欧文文字が [テキスト] ウィンドウに表示されない場合

CJK 言語のテキストが [テキスト] ウィンドウで正しく表示されない場合は、[テキストのみ] モードが選択されている可能性があります。

[テキストのみ] モードで使用されるフォントを変更するには

  1. [オプション] ダイアログ ボックスを開きます ([ツール] > [オプション…])。
  2. [表示] タブをクリックします。
  3. [プレーン テキストの表示に使用するフォント] ドロップダウン リストから [Arial Unicode MS] を選択します。
  4. [OK] をクリックします。

問題が解消されず、[テキスト] ウィンドウでテキストが依然として正しく表示されない場合は、「テキスト ウィンドウで一部の文字が「?」または「□」で置き換えられている場合」を参照してください。

認識したテキストの向きの変更

ABBYY FineReader はテキストの向きを自動的に検出しますが、テキストの向きを手動で指定することもできます。

  1. [テキスト] ウィンドウで 1 つまたは複数の段落を選択します。
  2. [テキスト] ウィンドウのツールバーにある ボタンをクリックします。

注意:認識の前に [画像] ウィンドウの [ CJK テキストの向き] ドロップダウン リストを使用してテキストの向きを指定することができます。詳細については、「縦書きのテキストまたは反転したテキストが認識されない場合」を参照してください。

1/14/2020 5:26:20 PM


Please leave your feedback about this article