OCR 作業前要考慮的文件功能

影像品質對 OCR 品質有重大影響。 本部分講解辨識圖像前需要考慮的因素。

OCR 語言

ABBYY FineReader 可以辨識單語言文件和多語言文件(如以兩種或兩種以上語言撰寫的)。 對於多語言文件,您需要選擇多種辨識語言。

若要選擇 OCR 語言,請按一下 選項 > 語言 並選擇以下一種選項:

  • 從下列清單中自動選取 OCR 語言
    ABBYY FineReader 將自動從使用者定義的語言清單中選擇適當的語言。 若要編輯語言清單:
    1. 請確保 從下列清單中自動選取 OCR 語言 選擇了選項。
    2. 按一下 指定... 按鈕。
    3. 語言 對話方塊中,選擇想要的語言並按一下 確定
    4. 選項 對話方塊,按一下 確定。
  • 手動指定 OCR 語言
    如果清單中沒有您需要的語言,請選擇這個選項。

在下面的對話方塊中,指定一個或多個語言。 如果您經常使用特定的語言組合,您可以 為這些語言 建立一個新的群組。

如果某種語言不在該清單中,則:

  1. 或是 ABBYY FineReader 不支援該語言,或是
    如需支援語言的完整清單,請參閱 支援的 OCR 語言
  2. 不支援您的產品版本。
    在「授權」中可找到您的產品版本的完整 語言清單 選項(按一下 說明 > 關於 > 授權資訊 以開啟此對話方塊)。

除使用內建的語言和語言群組之外,您還可以建立自己的語言和語言群組。另請參閱: 若程式未能辨識某些字元

列印類型

文件可使用多種裝置進行列印,如打字機和傳真。 OCR 品質可能取決於文件是如何列印的。 您可以在對話方塊中透過選擇合適的列印類型 選項 選項。

對於大多數文件,程式將自動偵測其列印類型。 對於自動列印類型的偵測, 自動 必須在對話方塊的群組選項中 文件類型 選擇 選項 選項(按一下 工具 > 選項... > OCR 以存取這些選項)。 您可以在用彩色或黑白顏色模式下處理文件。

如有需要,您也可以選擇手動選擇列印類型。

打印文本的範例。 所有字母寬度均相等(比較,例如,字母「w」和「t」)。 對於此類型的文字,選取 打字機
由一台傳真機打印的文字範例。 從該範例可以看出,有些地方的字母還不清楚。 另外還有一些雜訊和失真。 對於此類型的文字,選取 傳真

識別列印的文字或傳真,請務必選擇 自動 處理通常列印的文件之前。

列印品質

對於有「雜點」(即,偶爾的黑點和斑點)、髒污和字母大小不一、或扭曲的行和偏移的表格邊界的品質差的文件,可能需要特定的掃描設定。

傳真 報紙

品質較差的文件最好使用灰階 掃描。 以灰階掃描時,程式會自動選擇最佳化的 亮度 值。

在辨識中等至差品質的文件時,灰階掃描模式在掃描文字中保留更多有關字母的資訊,以達到更佳的 OCR 結果。 您還可以使用「影像編輯器」中可用的影像編輯工具手動修正某些缺陷。 另請參閱: 如果您的文件圖像有缺陷,OCR 準確性將較低

彩色模式

如果您不需要保留彩色文件的原始顏色,您可以在黑白模式下處理文件。 這將顯著降低產生的 OCR 專案大小,並加速 OCR 處理過程。 但是,以黑白模式處理品質欠佳的圖像可導致 OCR 品質較低。 我們也不建議使用黑白模式處理照片、雜誌頁面以及使用中文、日語和韓語的文字。

提示。 您也可以透過選擇對話方塊上的標籤, 快速辨識OCR 在對話方塊 選項 選項。 有關辨識模式的更多資訊,請參閱 OCR 選項

有關選擇正確的顏色模式的一些其他建議,請參閱 掃描提示

一旦文件被轉換為黑白,您將無法還原顏色。 若要取得彩色文件,開啟具有彩色圖像的檔案或在彩色模式下掃描紙質文件。

07.09.2020 20:12:33


Please leave your feedback about this article