如果您列印的文件包含非標準字型

訓練模式可改善含裝飾字型文件或含特殊字元 (例如:數學符號) 文件的 OCR 品質。

注意:不推薦在其他情況下使用訓練模式,因為相對於在訓練上所花費的時間和精力,辨識品質的提升並不顯著。

在「訓練」模式中建立使用者模式,此模式可在對全文執行 OCR 時使用。

使用使用者模式

若要使用模式辨識文件:

  1. 開啟選項對話方塊 (工具>選項…),然後按一下 讀取標籤。
  2. 訓練下,選取 僅使用使用者模式選項。

注意:如果選取 使用內建和使用者模式,ABBYY FineReader 12 將同時使用使用者模式及廠商預設模式執行 OCR 作業。

  1. 按一下模式編輯器…按鈕。
  2. 模式編輯器對話方塊中,選取想要的模式,然後按一下確定
  3. 在 ABBYY FineReader 主視窗中,按一下讀取按鈕。

建立和訓練使用者模式

要訓練使用者模式以辨識新字元和連字:

  1. 開啟選項對話方塊 (工具>選項…),然後按一下 讀取標籤。
  2. 訓練下,選取 使用內建和使用者模式僅使用使用者模式
  3. 選取透過訓練讀取選項。
  4. 按一下模式編輯器…按鈕。

注意:模式訓練不支援亞洲語言。

  1. 模式編輯器對話方塊中,按一下新增…
  2. 建立模式對話方塊將開啟。鍵入工作站名稱並按一下確定
  3. 透過分別按一下確定按鈕來關閉模式編輯器選項對話方塊。
  4. 影像視窗頂部的工具列上,按一下讀取

現在,如果 ABBYY FineReader 遇到未知字元,則該字元將會顯示在 模式訓練對話方塊中。

  1. 講授程式讀取新字元連字

連字是兩個或三個「膠合」字元的組合 (如 fi、fl、ffi 等),程式很難將之分開。實際上,將其視為單一的複合字元結果更佳。

注意:透過在效果下選取對應的選項,可保留在您的上標/下標文字或字詞中列印為粗體或斜體類型的字詞。

若要回到上次訓練的字元,請按一下上一步按鈕。框架將跳至上一個位置,且對應的最新訓練「字元影像鍵盤字元」將從模式中移除。上一步按鈕在一個字詞的字元間瀏覽,而不會在字詞之間瀏覽。

注意事項﹗

  • 可僅訓練 ABBYY FineReader 使其閱讀辨識語言字母中所包含的字元。若要訓練程式以讀取無法從鍵盤輸入的字元,請使用兩個字元的組合以代表這些不存在的字元,或從插入字元對話方塊 (按一下 以開啟對話方塊) 複製想要的字元。
  • 每種模式將包含多達 1,000 個新字元。 但請避免建立過多連字,因為這可能會對 OCR 品質產生負面影響。

選取使用者模式

ABBYY FineReader 允許使用模式以改善 OCR 品質。

  1. 工具功能表上,按一下模式編輯器…
  2. 模式編輯器對話方塊中,從可用模式清單選取想要的模式,並按一下 設定和啟用

需記住的一些要點:

  1. ABBYY FineReader 會將一些相似但不同的字元辨識為一個或相同字元,而不會予以區分。 例如,直引號 (')、左引號 (‘),及右引號 (’) 將作為單一字元 (直引號) 儲存於模式中。這表示即使您嘗試定型左和右引號,其也不會用於已辨識的文字中。
  2. 對於某些字元影像,ABBYY FineReader 將根據上下文,選取對應的鍵盤字元。例如,如果上下文為字母,會將小圓形影像辨識為字母 O,如果緊挨著其周圍的為數字,則會將其辨識為數字 0。
  3. 文件用於建立模式時,模式僅可用於有相同字型、字型大小及解析度的文件。
  4. 為稍後能夠使用模式,將該模式儲存至檔案中。請參閱「 FineReader 檔案是什麽?」瞭解詳細資訊。
  5. 要辨識以不同字型設定的文字,請選取僅使用內建模式選項 (在工具>選項… > 讀取)。

編輯使用者模式

您可能想要在啟動 OCR 程序前,編輯新建立的模式。 不正確的定型模式可能會對 OCR 品質產生負面影響。模式應僅包含完整字元或連字。應從模式中將切邊的字元和含未正確對應字母的字元移除。

  1. 工具功能表上,按一下 模式編輯器…
  2. 模式編輯器對話方塊將開啟。選取所需的模式,然後按一下編輯…按鈕。
  3. 在開啟的 使用者模式對話方塊中,選擇字元,然後按一下 屬性…按鈕。

在開啟的對話方塊中:

  • 輸入與 字元欄位相對應的字母
  • 效果欄位中指定所需字型效果 (斜體、粗體、上標和下標)。

使用者模式中按一下 刪除按鈕以刪除錯誤訓練的字元。

1/14/2020 5:26:22 PM


Please leave your feedback about this article