OCR 作業前要考慮的文件特徵

影像品質可以對辨識品質產生重大影響。本部分講解釋辨識圖像前需要考慮的因素:

文件語言

ABBYY FineReader 可以辨識單語言文字和多語言文字 (如使用兩種及以上語言)。對於多語言文字,需要選擇多種辨識語言。

要為文字指定一種 OCR 語言,請從主工具列或工作視窗的文件語言下拉清單中選擇下列選項之一:

  • 自動選取

ABBYY FineReader 將自動從語言的使用者定義清單選取適當語言。若要修改此清單:

  1. 請選取更多語言…
  2. 語言編輯器對話方塊中,選取 從下列清單中自動選取文件語言選項。
  3. 按一下指定…按鈕。
  4. 語言對話方塊中,選取所需的語言。
  • 語言或語言組合

選取語言或語言組合。語言清單中包含最近使用的辨識語言,以及英語、德語和法語。

  • 更多語言…

如果在清單上看不到您所需的語言,選取此選項。

語言編輯器對話方塊中,選取 手動指定語言選項,然後在適當的方塊中打勾來選取所需的語言。如果經常使用特定語言組合,您可以為這些語言建立新群組

如果某種語言不在該列表中,則:

  1. ABBYY FineReader 不支援這種語言。

如需有關受支援語言的完整清單,請參閱「支援的語言」。

  1. 您的軟體複本不支援該語言。

授權對話方塊 (說明 > 關於… >授權資訊) 中可以找到您的版本中可用語言的完整清單。

除使用內建的語言和語言組之外,您還可以建立自己的語言。欲知詳細資訊,請參閱「如果程式未能辨識某些字元」。

列印類型

文件可透過多種設備進行列印,如打字機和傳真。選擇選項對話方塊中的文件類型可提高 OCR 品質。

用於大多數文件,此程式將自動偵測列印類型。要自動檢測列印類型,必須選擇選項對話方塊(工具>選項…)中的文件類型下的自動選項。您可在全色或黑白模式下處理文件。

您也可以根據需要選擇手動選取此列印類型。

用打字機打出的文字的範例。所有字母為等寬 (例如,比較「w」和「t」)。對於此類型的文字,選取打字機
傳真機產生文字的示例。正如示例所示,除雜點和失真之外,某些位置的字元不清晰。對於此類型的文字,選取傳真

提示:辨識打字機文字或傳真之後,務必在處理常規列印文件之前選取自動

列印品質

對於有「雜點」(即,偶爾的黑點和斑點)、髒污和字母大小不一、或扭曲的行和偏移的表格邊界的品質差的文件,可能需要特別的掃描設定。

傳真 報紙

品質差的文件最適合用灰階掃描。在以灰階掃描時,程式會自動選擇最佳化的亮度值。

在辨識中至差品質的文件時,灰階掃描模式在掃描文字中保留更多有關字母的資訊以達到更佳的 OCR 結果。您還可以使用「影像編輯器」中的影像編輯工具手動修正某些缺陷。欲知詳細資訊,請參閱「影像預處理」。

色彩模式

如果您不需保留全色文件中的原始顏色,您可在黑白模式下處理文件。這將顯著降低 ABBYY FineReader 文件的大小並加速 OCR 程序。但是,以黑白模式處理品質欠佳的圖像可能導致 OCR 品質欠佳。我們也不推薦使用黑白模式處理照片、雜誌頁面以及使用中文、日語和韓語的文字。

注意:您也可以透過選擇快速讀取選項提高彩色和黑白文件的辨識速度, 快速讀取選項位於選項對話方塊中的讀取標籤。欲瞭解有關辨識模式的更多資訊,請參閱 OCR 選項

若要選取色彩模式:

  • 使用 工作對話方塊中的色彩模式下拉式清單,或
  • 選擇選項對話方塊 (工具>選項…) 中文件標籤下的色彩模式

注意事項﹗一旦文件被轉換為黑白,您將無法還原顏色。若要取得彩色文件,請開啟具有彩色圖像的檔案或在色彩模式下掃描紙張文件。

1/14/2020 5:26:22 PM


Please leave your feedback about this article