프로그램이 특정 문자를 인식하지 못하는 경우

ABBYY FineReader 14는 텍스트를 인식할 때 문서 언어의 데이터를 사용합니다. 문서에 일반적이지 않은 요소(예: 코드 번호)가 있는 경우 프로그램에서 일부 문자를 인식하지 못하는 경우도 있습니다. 문서 언어에 이러한 문자가 없을 수도 있기 때문입니다. 이러한 문서를 인식하려면, 필요한 모든 문자가 있는 사용자 지정의 언어를 만들면 됩니다. 또한 여러 OCR 언어를 그룹화하면, 문서를 인식할 때 이 그룹 언어를 사용할 수도 있습니다.

사용자 언어를 작성하는 방법

  1. 대화 상자를 옵션 열고(도구 >를 옵션... 클릭하여 대화 상자 열기) 언어 탭을 클릭합니다.
  2. 해당 새로 만들기... 버튼을 클릭합니다.
  3. 대화 상자의 옵션 항목에서 기존 언어를 바탕으로 새 언어 만들기 새 언어의 기준으로 사용하려는 언어를 선택하여 확인클릭합니다.
  4. 그러면 대화 상자가 언어 속성 열립니다. 이 대화 상자에서 다음을 수행합니다.
    1. 새 언어 이름을 입력합니다.
    2. 대화 상자에서 선택한 언어는 새 언어 또는 그룹 드롭다운 목록에 원본 언어 표시됩니다. 드롭다운 목록에서 다른 언어를 선택할 수 있습니다.
    3. 여기에는 알파벳 기준 언어의 알파벳이 포함됩니다. 알파벳을 편집하려면 버튼을 클릭합니다.
    4. 사전 옵션 그룹에는 텍스트를 인지하고 결과를 확인할 때 프로그램에서 사용할 사전에 대한 여러 옵션을 포함합니다.
      • 없음
        언어에는 사전이 없고
      • 기본 제공 사전
        프로그램에서 내장한 사전을 사용합니다.
      • 사용자 사전
        해당 버튼을 클릭하여 편집... 사전 용어를 지정하거나 기존의 사용자 지정 사전이나 Windows의 1252 인코딩된 텍스트 파일을 가져옵니다 (용어는 알파벳이 아닌 공백이나 다른 문자로 구분해야 합니다).
        사용자 사전에 있는 단어는 인식된 텍스트의 맞춤법을 검사 할 때 맞춤법이 틀린 것으로 표시되지 않습니다. 모두 소문자나 대문자로 작성될 수 있으며 대문자로 시작할 수도 있습니다.
사전에 수록된 단어 맞춤법을 확인하여 틀리지 않는 단어로 확인
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
Abc aBc, abc, Abc, ABC
  • 다음은 정규식 정규식을 사용하여 사용자 사전을 만들 수 있습니다.
    참조: 정규식.
  1. 언어에는 몇 가지 추가 속성이 있습니다. 이 속성을 변경하려면 고급... 버튼을 클릭하여 고급 언어 속성 다음을 지정할 수 있는 대화 상자를 엽니다.
    • 단어 시작과 끝에 올 수 있는 문자
    • 단어와 구분되어 표시되는 알파벳이 아닌 문자
    • 단어 사이에 표시되지만 무시되어야만 하는 문자
    • 해당 언어로 인식하여 텍스트로 나타나지 않는 문자 (금지된 문자)
    • 해당 텍스트에 아라비아 숫자, 로마 숫자 및 약어가 포함되어 있을 수 있음 옵션
  2. OCR 언어를 선택할 때 새롭게 생성된 언어를 선택할 수 있습니다.
    자세한 OCR 언어에 대해서는 다음 OCR 언어를 참조하세요.

사용자 언어는 OCR 프로젝트의 폴더에 기본으로 저장됩니다. 또한 모든 사용자 패턴 및 언어는 단일 파일로 저장할 수 있습니다. 이렇게 하려면,대화 상자를 옵션 엽니다 (도구 >를 옵션... 클릭하여 대화 상자 열기) OCR 탭을 클릭하고 패턴 및 언어 저장하기 버튼을 클릭합니다.

언어 그룹 만들기

특정 언어 조합을 정기적으로 사용하려면, 해당 언어를 함께 그룹화하여 편리하게 사용할 수 있습니다.

  1. 대화 상자를 옵션 열고 ( 도구 >를 옵션... 클릭하여 대화 상자 열기) 탭을 언어 클릭합니다.
  2. 해당 새로 만들기... 버튼을 클릭합니다.
  3. 대화 상자에서 새 언어 또는 그룹 옵션을 선택하여 새 언어 그룹 만들기 클릭합니다 확인.
  4. 그러면 대화 상자가 언어 그룹 속성 열립니다. 이 대화 상자에서 언어 그룹의 이름을 지정하고 그룹에 포함시키려는 언어들을 선택합니다.
    텍스트에 특정 문자가 포함되지 않는 것이 확실한 경우 이와 같은 일종의 금지 문자를 명시적으로 지정할 수 있습니다. 이렇게 하면 OCR의 속도와 정확성이 높아집니다. 이런 문자를 지정하려면 고급... 대화 상자에서 언어 그룹 속성 해당 버튼을 클릭하여 필드에 금지 문자 금지 문자를
  5. 입력합니다 확인.

새 그룹은 기본 도구 도음의 드롭다운 언어 목록에 표시됩니다.

사용자 언어 그룹은 OCR 프로젝트의 폴더에 기본으로 저장됩니다. 또한 모든 사용자 패턴 및 언어는 단일 파일로 저장할 수 있습니다. 이렇게 하려면,대화 상자를 열고 옵션 (도구 >를 옵션... 클릭하여 대화 상자 열기) 탭을 OCR 클릭하여 패턴 및 언어 저장하기 버튼을 클릭합니다.

팁. 언어 그룹을 선택하려면 기본 도구 모음에서 드롭다운 언어 목록을 사용합니다.

  1. 기본 도구 모음의 드롭다운 언어 목록에서 추가 언어... 선택합니다.
  2. 대화 상자에서 언어 편집기 옵션을 OCR 언어 수동 지정 선택합니다.
  3. 원하는 언어를 선택하여 확인클릭합니다.

02.11.2018 16:19:44


Please leave your feedback about this article