若程式未能辨識某些字元

ABBYY FineReader 在辨識文字時使用文件語言相關的資料。對於包含很多非常用元素 (如代碼編號) 的文字,程式可能無法辨識某些字元,因為文件語言可能沒有包含此類字元。要辨識此類文件,可建立自訂語言,其中包括了所有需要的字元。也可分配多種語言給語言群組,然後使用這些群組進行辨識。

建立使用者語言

  1. 工具功能表上,按一下語言編輯器…
  2. 語言編輯器對話方塊中,按一下新增…
  3. 在開啟的對話方塊中,選擇根據現有語言建立新的語言選項,然後選擇新語言所依據的語言並按一下確定
  4. 將開啟語言屬性對話方塊。在此對話方塊中:
    1. 輸入新語言的名稱:
    2. 之前選擇的基礎語言將顯示在來源語言下拉清單中。可變更源語言。
    3. 字母包含了基礎語言的字母。按一下 按鈕以編輯字母。
    4. 程式辨識文字和檢查結果時,將會用到幾個與字典相關的選項。

該語言將不會有字典。

  • 內建字典

將使用程式的內建字典。

  • 使用者字典

按一下編輯…按鈕以指定字典專案,或導入現有自訂字典或帶有 Windows-1252 編碼的文字檔案 (專案之間必須以空格或以其他非字母表中的字元隔開)。

注意:檢查所辨識文字的拼寫時,不會將使用者字典中的字詞標記為錯誤。它們可能全部使用小寫字母或大寫字母,或者可能以大寫字母開頭。

字典中的字詞 拼寫檢查時不會認為是錯誤的字詞。
abc abc、Abc、ABC
Abc abc、Abc、ABC
ABC abc、Abc、ABC
aBc aBc、abc、Abc、ABC
  • 規則運算式

可使用規則運算式建立自訂語言字典。

欲知詳細資訊,請參閱「規則運算式」。

  1. 語言可具有其他幾種屬性。按一下 進階…按鈕以變更這些屬性。

將開啟進階語言屬性對話方塊。可在此處指定:

  • 可作為字詞開頭或結尾的字元
  • 與字詞分開顯示的非字母字元
  • 顯示在字詞之間應忽略的字元。
  • 無法顯示在使用此字典辨識的文字中的字元 (禁用字元)
  • 該語言所有可辨識的字元
  • 還可啟用 可能包含阿拉伯數字、羅馬數字、縮寫的文字選項
  1. 現在,選擇文件語言時可選擇新建立的語言。

有關文件語言的更多資訊,請參閱「OCR 作業前要考慮的文件特徵」。

依預設,使用者群組會儲存在 FineReader 文件資料夾中。您還可以將所有使用者語言和使用者模式另存為單個檔案。為此,在工具功能表中,按一下選項…以開啟選項對話方塊,按一下 讀取標籤,然後按一下儲存到文件...按鈕。

建立語言群組

如果需定期使用特定語言組合,您可能想將語言組成群組以便使用。

  1. 工具功能表上,按一下語言編輯器…
  2. 語言編輯器對話方塊中,按一下新增…
  3. 新增語言或群組對話方塊中,選取建立新的語言群組並按一下確定
  4. 語言群組屬性 對話方塊中,鍵入新群組的名稱,並選取想要的語言。

注意:如果您知道文字中將不會包含某些字元,可能會要明確指定這些所謂禁止使用的字元。指定禁止使用的字元可同時提高辨識速度及品質。若要指定禁止使用的字元,請按一下進階…按鈕,该按钮位于語言群組屬性對話方塊中。在進階語言群組屬性對話方塊中,將禁止使用的字元鍵入禁止使用的字元欄位。

  1. 按一下確定

新建立的群組將新增至文件語言下拉式清單,該清單位於 主工具列視窗中。

依預設,使用者語言群组將儲存在 FineReader 文件資料夾中。您還可以將所有使用者語言和使用者模式另存為單個檔案。為此,在工具功能表中,按一下選項…以開啟選項對話方塊,按一下 讀取標籤,然後按一下儲存至檔案…按鈕。

提示:如果需文件的特定語言組合,您也可直接選取想要的語言,而無需建立其群組。

  1. 文件語言下拉式清單中選取更多語言…。
  2. 語言編輯器對話方塊中,選取 手動指定語言
  3. 選取想要的語言並按一下取消

1/14/2020 5:26:22 PM


Please leave your feedback about this article