若程式未能辨識某些字元

Download

ABBYY FineReader 在辨識文字時使用文件語言相關的資料。對於包含很多非常用元素 (如代碼編號) 的文字,程式可能無法辨識某些字元,因為文件語言可能沒有包含此類字元。要辨識此類文件,可建立自訂語言,其中包括了所有需要的字元。也可分配多種語言給語言群組,然後使用這些群組進行辨識。

建立使用者語言

  1. 工具功能表上,按一下語言編輯器…
  2. 語言編輯器對話方塊中,按一下新增…
  3. 在開啟的對話方塊中,選擇根據現有語言建立新的語言選項,然後選擇新語言所依據的語言並按一下確定
  4. 將開啟語言屬性對話方塊。在此對話方塊中:
    1. 輸入新語言的名稱:
    2. 之前選擇的基礎語言將顯示在來源語言下拉清單中。可變更源語言。
    3. 字母包含了基礎語言的字母。按一下 按鈕以編輯字母。
    4. 程式辨識文字和檢查結果時,將會用到幾個與字典相關的選項。

該語言將不會有字典。

  • 內建字典

將使用程式的內建字典。

  • 使用者字典

按一下編輯…按鈕以指定字典專案,或導入現有自訂字典或帶有 Windows-1252 編碼的文字檔案 (專案之間必須以空格或以其他非字母表中的字元隔開)。

注意:檢查所辨識文字的拼寫時,不會將使用者字典中的字詞標記為錯誤。它們可能全部使用小寫字母或大寫字母,或者可能以大寫字母開頭。

字典中的字詞 拼寫檢查時不會認為是錯誤的字詞。
abc abc、Abc、ABC
Abc abc、Abc、ABC
ABC abc、Abc、ABC
aBc aBc、abc、Abc、ABC
  • 規則運算式

可使用規則運算式建立自訂語言字典。

欲知詳細資訊,請參閱「規則運算式」。

  1. 語言可具有其他幾種屬性。按一下 進階…按鈕以變更這些屬性。

將開啟進階語言屬性對話方塊。可在此處指定:

  • 可作為字詞開頭或結尾的字元
  • 與字詞分開顯示的非字母字元
  • 顯示在字詞之間應忽略的字元。
  • 無法顯示在使用此字典辨識的文字中的字元 (禁用字元)
  • 該語言所有可辨識的字元
  • 還可啟用 可能包含阿拉伯數字、羅馬數字、縮寫的文字選項
  1. 現在,選擇文件語言時可選擇新建立的語言。

有關文件語言的更多資訊,請參閱「OCR 作業前要考慮的文件特徵」。

依預設,使用者群組會儲存在 FineReader 文件資料夾中。您還可以將所有使用者語言和使用者模式另存為單個檔案。為此,在工具功能表中,按一下選項…以開啟選項對話方塊,按一下 讀取標籤,然後按一下儲存到文件...按鈕。

建立語言群組

如果需定期使用特定語言組合,您可能想將語言組成群組以便使用。

  1. 工具功能表上,按一下語言編輯器…
  2. 語言編輯器對話方塊中,按一下新增…
  3. 新增語言或群組對話方塊中,選取建立新的語言群組並按一下確定
  4. 語言群組屬性 對話方塊中,鍵入新群組的名稱,並選取想要的語言。

注意:如果您知道文字中將不會包含某些字元,可能會要明確指定這些所謂禁止使用的字元。指定禁止使用的字元可同時提高辨識速度及品質。若要指定禁止使用的字元,請按一下進階…按鈕,该按钮位于語言群組屬性對話方塊中。在進階語言群組屬性對話方塊中,將禁止使用的字元鍵入禁止使用的字元欄位。

  1. 按一下確定

新建立的群組將新增至文件語言下拉式清單,該清單位於 主工具列視窗中。

依預設,使用者語言群组將儲存在 FineReader 文件資料夾中。您還可以將所有使用者語言和使用者模式另存為單個檔案。為此,在工具功能表中,按一下選項…以開啟選項對話方塊,按一下 讀取標籤,然後按一下儲存至檔案…按鈕。

提示:如果需文件的特定語言組合,您也可直接選取想要的語言,而無需建立其群組。

  1. 文件語言下拉式清單中選取更多語言…。
  2. 語言編輯器對話方塊中,選取 手動指定語言
  3. 選取想要的語言並按一下取消

14.01.2020 17:26:22

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.