使用複雜字集語言

使用 ABBYY FineReader,您可以辨識阿拉伯語、希伯來語、意第緒語、泰國語、中文、日語和韓語文件。 處理中文、日語或韓語文件,以及混合使用中日韓 (CJK) 語言和歐洲語言的文件時,必須考慮一些其他因素。

建議字型

要辨識阿拉伯語、希伯來語、意地緒語、泰國語、中文、日語和韓語,可能需要在 Windows 中安裝更多的字型軟體。 以下列表顯示了對應這些語言的建議使用字型。

OCR 語言 建議的字型
阿拉伯文 Arial™ Unicode™ MS
希伯來文 Arial™ Unicode™ MS
意第緒語 Arial™ Unicode™ MS
泰文

Arial™ Unicode™ MS

Aharoni

David

Levenim mt

Miriam

Narkisim

Rod

簡體中文

繁體中文

日語、 韓語

朝鮮 (朝鮮文)

Arial™ Unicode™ MS

如 SimSun 字型:

範例 SimSun (Founder Extended),

SimSun 18030,NSimSun。

黑體

幼圓

PMingLiU

細明體

香港增補字符集 (支援 ISO10646)

華文宋體

以下部分包含關於提高識別準確度的建議。

停用影像自動處理

預設情況下,任何新增到 OCR 專案 OCR 專案 可以自動識別。

但是,如果您的文件包含 CJK 語言和歐洲語言的文字,我們建議停用自動偵測頁面方向,僅當所有頁面影像方向正確(例如掃描時未上下顛倒)時使用雙頁分割選項。

您可以啟用/停用 修正頁面方向分割對開頁面 對話方塊中 圖像處理 在對話方塊 選項 選項(按一下 工具 > 選項... 以開啟此對話方塊)。

若要分割阿拉伯文、希伯來文或意第緒語的對開頁面,一定要先選取對應的OCR 語言,然後再選擇 分割對開頁面 選項。 您還可以透過選擇該選項來恢復原始 交換書頁 選項。 另請參閱: OCR 專案

如果您的文件有一個複雜的結構,我們建議停用自動分析和 OCR 影像,手動執行這些操作。

您可以關閉自動分析,關閉 圖像處理 在對話方塊 選項 選項(按一下 工具 > 選項... 以開啟此對話方塊)。

  1. 按一下 工具 > 選項... 以開啓 方塊 選項 選項。
  2. 圖像處理 標籤上,清除  在頁面影像新增至 OCR 編輯器時自動處理 選項。
  3. 按一下 確定

辨識以多種語言寫成的文件

下面的說明提供為例,解釋如何識別包含英文和中文文字的文件。 包含其他語言的文件可以類似的方式識別。

  1. 在主工具列上,從 更多語言... 語言清單上選擇 在 語言編輯器 對話方塊中選擇 手動指定 OCR 語言 從語言清單中選擇中文和英文。
  2. 掃描頁面或開啟頁面影像。
  3. 如果程式無法偵測影像上所有區域:
    • 使用區域編輯工具 手動指定區域
    • 指定任何只包含一種語言的區域 區域屬性 酌情選擇中文或英文。
      一種語言僅可指定給類型相同的區域。 如果您選擇了不同類型的區域,如 文字表格,您將無法指定一種語言。
    • 如果需要,從下拉式清單中選擇文字方向 方向 (有關詳細資訊,請參閱 如果無法識別垂直或反相文字
    • 對於 CJK 語言的文字,在下拉式清單中,該程式提供文字方向的選擇 CJK 文本方向 (有關詳細資訊,請參閱 編輯區域屬性)

如果「文字」窗格中不顯示非歐洲字元

如果 CJK 語言在文字窗格中顯示文字 您可能選擇該 純文字 模式。

若要變更模式中使用的 純文字 字型:

  1. 按一下 工具 > 選項... 以開啓 方塊 選項 選項。
  2. 按一下 區域和文字 標籤。
  3. 從下拉式清單中 用於顯示純文字的字型 其中一個選項。
  4. 按一下 確定

如果執行無效, 文字 仍然顯示不正確,請參閱 不正確字型被使用,或以「?」或「□」取代部分字元

變更已辨識文字的方向

ABBYY FineReader 自動偵測文字方向,但是您也可以手動指定文字方向。

  1. 啟動「文字」窗格。
  2. 選取一段或多段
  3. 按一下 「文字」窗格中工具列上的按鈕。

您可以使用 CJK 文本方向 「影像」窗格中的下拉式清單來指定 OCR 之前的文字方向。 另請參閱: 編輯區域屬性

9/7/2020 8:12:33 PM


Please leave your feedback about this article