OCR 作業前要考慮的文件功能

Download

影像品質對 OCR 品質有重大影響。 本部分講解辨識圖像前需要考慮的因素。

OCR 語言

ABBYY FineReader 可以辨識單語言文件和多語言文件(如以兩種或兩種以上語言撰寫的)。 對於多語言文件,您需要選擇多種辨識語言。

若要選擇 OCR 語言,請按一下 選項 > 語言 並選擇以下一種選項:

  • 從下列清單中自動選取 OCR 語言
    ABBYY FineReader 將自動從使用者定義的語言清單中選擇適當的語言。 若要編輯語言清單:
    1. 請確保 從下列清單中自動選取 OCR 語言 選擇了選項。
    2. 按一下 指定... 按鈕。
    3. 語言 對話方塊中,選擇想要的語言並按一下 確定
    4. 選項 對話方塊,按一下 確定。
  • 手動指定 OCR 語言
    如果清單中沒有您需要的語言,請選擇這個選項。

在下面的對話方塊中,指定一個或多個語言。 如果您經常使用特定的語言組合,您可以 為這些語言 建立一個新的群組。

如果某種語言不在該清單中,則:

  1. 或是 ABBYY FineReader 不支援該語言,或是
    如需支援語言的完整清單,請參閱 支援的 OCR 語言
  2. 不支援您的產品版本。
    在「授權」中可找到您的產品版本的完整 語言清單 選項(按一下 說明 > 關於 > 授權資訊 以開啟此對話方塊)。

除使用內建的語言和語言群組之外,您還可以建立自己的語言和語言群組。另請參閱: 若程式未能辨識某些字元

列印類型

文件可使用多種裝置進行列印,如打字機和傳真。 OCR 品質可能取決於文件是如何列印的。 您可以在對話方塊中透過選擇合適的列印類型 選項 選項。

對於大多數文件,程式將自動偵測其列印類型。 對於自動列印類型的偵測, 自動 必須在對話方塊的群組選項中 文件類型 選擇 選項 選項(按一下 工具 > 選項... > OCR 以存取這些選項)。 您可以在用彩色或黑白顏色模式下處理文件。

如有需要,您也可以選擇手動選擇列印類型。

打印文本的範例。 所有字母寬度均相等(比較,例如,字母「w」和「t」)。 對於此類型的文字,選取 打字機
由一台傳真機打印的文字範例。 從該範例可以看出,有些地方的字母還不清楚。 另外還有一些雜訊和失真。 對於此類型的文字,選取 傳真

識別列印的文字或傳真,請務必選擇 自動 處理通常列印的文件之前。

列印品質

對於有「雜點」(即,偶爾的黑點和斑點)、髒污和字母大小不一、或扭曲的行和偏移的表格邊界的品質差的文件,可能需要特定的掃描設定。

傳真 報紙

品質較差的文件最好使用灰階 掃描。 以灰階掃描時,程式會自動選擇最佳化的 亮度 值。

在辨識中等至差品質的文件時,灰階掃描模式在掃描文字中保留更多有關字母的資訊,以達到更佳的 OCR 結果。 您還可以使用「影像編輯器」中可用的影像編輯工具手動修正某些缺陷。 另請參閱: 如果您的文件圖像有缺陷,OCR 準確性將較低

彩色模式

如果您不需要保留彩色文件的原始顏色,您可以在黑白模式下處理文件。 這將顯著降低產生的 OCR 專案大小,並加速 OCR 處理過程。 但是,以黑白模式處理品質欠佳的圖像可導致 OCR 品質較低。 我們也不建議使用黑白模式處理照片、雜誌頁面以及使用中文、日語和韓語的文字。

提示。 您也可以透過選擇對話方塊上的標籤, 快速辨識OCR 在對話方塊 選項 選項。 有關辨識模式的更多資訊,請參閱 OCR 選項

有關選擇正確的顏色模式的一些其他建議,請參閱 掃描提示

一旦文件被轉換為黑白,您將無法還原顏色。 若要取得彩色文件,開啟具有彩色圖像的檔案或在彩色模式下掃描紙質文件。

17.05.2023 7:35:22

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.