使用複雜字集語言

使用 ABBYY FineReader,您可以辨識阿拉伯語、希伯來語、意第緒語、泰國語、中文、日語和韓語文件。處理中文、日語或韓語文件,以及混合使用中日韓 (CJK) 語言和歐洲語言的文件時,必須考慮一些其他因素。

安裝語言支援

為了能辨識阿拉伯語、希伯來語、意地緒語、泰國語、中文、日語和韓語文字,您可能需要安裝這些語言。

依預設,Microsoft Windows 8、Windows 7 和 Windows Vista 支援這些語言。

若要在 Microsoft Windows XP 中安裝新語言:

  1. 在工具列上按一下開始
  2. 按一下控制面板 > 區域和語言選項
  3. 按一下語言標籤並選擇下列選項:
    • 安裝使用複雜字集和從右到左的語言的檔案 (包括泰文)

以支持阿拉伯語、希伯來語、意地緒語和泰國語

  • 安裝使用東亞語言的檔案

以支援日語、中文和韓語

  1. 按一下確定

建議字型

要辨識阿拉伯語、希伯來語、意地緒語、泰國語、中文、日語和韓語,可能需要在 Windows 中安裝更多的字型。以下列表顯示了對應這些語言的推薦字型。

OCR 語言 建議字型
阿拉伯文 Arial(TM) Unicode(TM) MS*
希伯來文 Arial(TM) Unicode(TM) MS*
意第緒語 Arial(TM) Unicode(TM) MS*
泰文

Arial(TM) Unicode(TM) MS*

Aharoni

David

Levenim mt

Miriam

Narkisim

Rod

簡體中文

繁體中文

日文、韓文、

韓文 (朝鮮文)

Arial(TM) Unicode(TM) MS*

宋體字型

例如:SimSun (Founder Extended)、SimSun-18030、NSimSun。

黑體

幼圓

新細明體

細明體

香港增補字符集 (支援 ISO10646)

華文宋體

*此字型將隨 Microsoft Windows XP 和 Microsoft Office 2000 或更新版本一併安裝。

以下部分包含關於提高辨識準確度的建議。

停用自動處理

依預設,將自動辨識您新增至 ABBYY FineReader 文件的任何頁面。

但是,如果您的文件包含 CJK 語言結合歐洲語言的文字,我們建議停用自動頁面方向偵測,僅當所有頁面影像具有正確方向 (例如掃描時未上下翻轉) 時使用雙頁分割選項。

偵測頁面方向 分割對開頁面選項可在 選項對話方塊的 掃描/開啟 標籤上啟用和停用。

注意:若要分割阿拉伯文、希伯來文或意第緒語的對開頁面,一定要先選取對應的辨識語言,然後再選擇 分割對開頁面選項。這將確保頁面以正確的順序排列。您也可以透過選擇交換書頁選項來恢復原始頁面編號。欲知詳細資訊,請參閱「FineReader 文件是什麼?」

如果您的文件結構複雜,我們建議停用影像自動分析和 OCR 並手動執行這些作業。

若要停用自動分析和 OCR:

  1. 開啟選項對話方塊 (工具>選項…)。
  2. 在新增頁面時自動處理標籤上清除 掃描/開啟選項。
  3. 按一下確定

辨識以一種以上語言寫成的文件

在下列說明中,以一個含有中英文文字的文件為例。

  1. 在主工具列上,從文件語言下拉清單中選擇更多語言…。從語言編輯器對話方塊選取手動指定語言並從語言清單中選取中文和英文。
  2. 掃描或開啟影像。
  3. 如果程式無法檢測圖像上的所有區域:
    • 使用區域編輯工具手動指定區域。
    • 指定任何只包含一種語言的區域。為此,請選擇這些區域並在區域屬性面板上指定相應的語言。

注意事項﹗該語言僅可指定給類型相同的區域。如果您選擇類型不同的區域,如文字表格,則無法指定一種語言。

  1. 按一下主工具列上的讀取按鈕。

如果「文字」視窗中不顯示非歐洲字元

如果 CJK 語言在文字視窗中顯示不正確,您可選取純文字模式。

若要變更 純文字模式中使用的字型:

  1. 開啟選項對話方塊 (工具> 選項…)。
  2. 按一下 檢視標籤。
  3. 用於顯示純文字的字型下拉清單中選擇 Arial Unicode MS
  4. 按一下確定

如果此舉無用,文字視窗的文字依然顯示不正確,請參閱如果「文字」視窗中的某些字元被替換成了「?」或「□」

變更已辨識文字的方向

ABBYY FineReader 自動偵測文字方向,但是您也可以手動指定方向。

  1. 文字視窗中選擇一個或多個段落。
  2. 按一下文字視窗工具列上的 按鈕。

注意:您可以使用影像視窗中的 CJK 文本方向,在文字辨識之前指定其方向。請參閱如果垂直或反相文字未辨識,以瞭解詳細資訊。

1/14/2020 5:26:22 PM


Please leave your feedback about this article