若程式未能辨識某些字元

ABBYY FineReader 14 使用關於文件語言的 資料 辨識文字時。 對於包含很多非常用元素 (如代碼編號) 的文字,程式可能無法辨識某些字元,因為文件語言可能沒有包含此類字元。 要辨識此類文件,可建立自訂語言,其中包括了所有需要的字元。 您還可以 建立多組 OCR 語言 使用這些語言識別文件。

如何建立使用者語言

  1. 開啓 選項 對話方塊(按一下 工具 > 選項... 開啟此對話方塊),請按一下 語言 標籤。
  2. 按一下 新建... 按鈕。
  3. 在開啟的對話方塊中,按一下 根據現有語言建立新的語言 選項,選擇您想要使用的語言,作為新語言的基礎,並按一下 確定
  4. 語言屬性 對話方塊。 在此對話方塊中:
    1. 為您的新語言鍵入一個名稱。
    2. 您在對話方塊中選取的語言 新增語言或群組 顯示在 來源語言 下拉式清單中。 您可以從下拉式清單中選擇不同的語言
    3. 字母 包含了基礎語言的字母表。 如果您想要編輯字母表,按一下 按鈕。
    4. 選項組 選項組包含幾個用於字典中的選項,程式辨識文字和檢查結果時,將會用到該字典。

      • 該語言將不會有字典。
      • 內建字典
        將使用程式的內建字典。
      • 使用者字典
        按一下 編輯... 按鈕以指定字典專案,或匯入現有自訂字典或帶有 Windows-1252 編碼的文字檔案 (專案之間必須以空格或以其他非字母表中的字元隔開)。
        檢查所辨識文字的拼寫時,不會將使用者字典中的字詞標記為拼字錯誤。 它們可能全部使用小寫字母或大寫字母,或者可能以大寫字母開頭。
字典中的字詞 拼字檢查時不會認為是錯誤的字詞。
abc abc、Abc、ABC
Abc abc、Abc、ABC
ABC abc、Abc、ABC
Abc aBc、abc、Abc、ABC
  • 規則運算式 使用正則運算式建立使用者字典。
    另請參閱: 正則運算式
  1. 語言可具有其他幾種屬性。 若要變更這些屬性,按一下 進階... 按鈕以開啓 進階語言屬性 對話方塊,在方塊中您可以指定:
    • 字詞的開頭或結尾的字元
    • 與字詞分開顯示的非字母字元
    • 出現在字詞內部但應忽略的字元
    • 無法顯示在使用此字典辨識的文字中的字元 (停用字元)
    • 可能包含阿拉伯數字、羅馬數字、縮寫的文字 選項
  2. 選擇 OCR 語言時,您可以選擇新建立語言。
    有關 OCR 語言的詳細資訊,請參閱 OCR 語言

預設情況下,使用者語言儲存在 OCR 專案資料夾中。 您還可以將所有使用者語言和使用者模式另存為單個檔案。 若要執行此操作,開啓 選項 對話方塊(按一下 工具 > 選項... 開啟此對話方塊),請按一下 OCR 標籤,然後按一下 儲存模式及語言... 按鈕。

建立語言群組

如果您常使用某個語言組合,為了便利,您或許希望把語言組合在

  1. 開啓 選項 對話方塊(按一下 工具 > 選項... 開啟此對話方塊),請按一下 語言 標籤。
  2. 按一下 新建... 按鈕。
  3. 新增語言或群組 對話方塊中,選擇 建立新的語言群組 按鈕,並按一下 確定
  4. 語言群組屬性 對話方塊。 在此對話方塊中,為語言群組指定一個名稱,並選擇您想要往該群組中新增的語言。
    如果您知道文字中將不會包含某些字元,可能會要明確指定這些所謂禁止使用的字元。 這樣做可以增加 OCR 的速度和準確性。 若要指定這些字元,按一下 進階... 對話方塊中的 語言群組屬性 按鈕,並在欄位中輸入 禁止使用的字元 禁用字元。
  5. 按一下 確定

新群組將顯示在主工具列上語言的 下拉式清單中

預設情況下,使用者語言群组將儲存在 FineReader 文件資料夾中 OCR 專案。 您還可以將所有使用者語言和使用者模式另存為單個檔案。 若要執行此操作,開啓 選項 對話方塊(按一下 工具 > 選項... 開啟此對話方塊),請按一下 OCR 標籤,然後按一下 儲存模式及語言... 按鈕。

提示。 主工具列上語言的下拉式清單,選擇語言群組。

  1. 從主工具列上語言的下拉式清單中 更多語言... 選擇
  2. 語言編輯器 對話方塊中,選擇 手動指定 OCR 語言 該選項。
  3. 選擇所需的語言,然後按一下 確定

11/2/2018 4:20:12 PM


Please leave your feedback about this article