OCR 作業前要考慮的文件特徵

Download

影像品質可以對辨識品質產生重大影響。本部分講解釋辨識圖像前需要考慮的因素:

文件語言

ABBYY FineReader 可以辨識單語言文字和多語言文字 (如使用兩種及以上語言)。對於多語言文字,需要選擇多種辨識語言。

要為文字指定一種 OCR 語言,請從主工具列或工作視窗的文件語言下拉清單中選擇下列選項之一:

  • 自動選取

ABBYY FineReader 將自動從語言的使用者定義清單選取適當語言。若要修改此清單:

  1. 請選取更多語言…
  2. 語言編輯器對話方塊中,選取 從下列清單中自動選取文件語言選項。
  3. 按一下指定…按鈕。
  4. 語言對話方塊中,選取所需的語言。
  • 語言或語言組合

選取語言或語言組合。語言清單中包含最近使用的辨識語言,以及英語、德語和法語。

  • 更多語言…

如果在清單上看不到您所需的語言,選取此選項。

語言編輯器對話方塊中,選取 手動指定語言選項,然後在適當的方塊中打勾來選取所需的語言。如果經常使用特定語言組合,您可以為這些語言建立新群組

如果某種語言不在該列表中,則:

  1. ABBYY FineReader 不支援這種語言。

如需有關受支援語言的完整清單,請參閱「支援的語言」。

  1. 您的軟體複本不支援該語言。

授權對話方塊 (說明 > 關於… >授權資訊) 中可以找到您的版本中可用語言的完整清單。

除使用內建的語言和語言組之外,您還可以建立自己的語言。欲知詳細資訊,請參閱「如果程式未能辨識某些字元」。

列印類型

文件可透過多種設備進行列印,如打字機和傳真。選擇選項對話方塊中的文件類型可提高 OCR 品質。

用於大多數文件,此程式將自動偵測列印類型。要自動檢測列印類型,必須選擇選項對話方塊(工具>選項…)中的文件類型下的自動選項。您可在全色或黑白模式下處理文件。

您也可以根據需要選擇手動選取此列印類型。

用打字機打出的文字的範例。所有字母為等寬 (例如,比較「w」和「t」)。對於此類型的文字,選取打字機
傳真機產生文字的示例。正如示例所示,除雜點和失真之外,某些位置的字元不清晰。對於此類型的文字,選取傳真

提示:辨識打字機文字或傳真之後,務必在處理常規列印文件之前選取自動

列印品質

對於有「雜點」(即,偶爾的黑點和斑點)、髒污和字母大小不一、或扭曲的行和偏移的表格邊界的品質差的文件,可能需要特別的掃描設定。

傳真 報紙

品質差的文件最適合用灰階掃描。在以灰階掃描時,程式會自動選擇最佳化的亮度值。

在辨識中至差品質的文件時,灰階掃描模式在掃描文字中保留更多有關字母的資訊以達到更佳的 OCR 結果。您還可以使用「影像編輯器」中的影像編輯工具手動修正某些缺陷。欲知詳細資訊,請參閱「影像預處理」。

色彩模式

如果您不需保留全色文件中的原始顏色,您可在黑白模式下處理文件。這將顯著降低 ABBYY FineReader 文件的大小並加速 OCR 程序。但是,以黑白模式處理品質欠佳的圖像可能導致 OCR 品質欠佳。我們也不推薦使用黑白模式處理照片、雜誌頁面以及使用中文、日語和韓語的文字。

注意:您也可以透過選擇快速讀取選項提高彩色和黑白文件的辨識速度, 快速讀取選項位於選項對話方塊中的讀取標籤。欲瞭解有關辨識模式的更多資訊,請參閱 OCR 選項

若要選取色彩模式:

  • 使用 工作對話方塊中的色彩模式下拉式清單,或
  • 選擇選項對話方塊 (工具>選項…) 中文件標籤下的色彩模式

注意事項﹗一旦文件被轉換為黑白,您將無法還原顏色。若要取得彩色文件,請開啟具有彩色圖像的檔案或在色彩模式下掃描紙張文件。

14.01.2020 17:26:22

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.