인쇄된 문서에 비표준 글꼴이 포함되는 경우

훈련 모드는 장식 글꼴이 있는 문서 또는 특수 문자(예: 수학 기호)를 포함하는 문서에서 OCR 품질을 향상시킵니다.

참고: 다른 경우에는 훈련 모드를 사용하지 않는 것이 좋습니다. 훈련에 소요되는 시간과 노력에 비해 인식 품질 향상 효과가 크지 않기 때문입니다.

훈련 모드에서는 사용자 패턴이 생성됩니다. 이 패턴은 전체 텍스트에 대해 OCR을 수행할 때 사용할 수 있습니다.

사용자 패턴 사용

패턴을 사용하여 문서를 인식하려면:

  1. 옵션 대화 상자(도구 > 옵션…)를 열고 인식 탭을 클릭합니다.
  2. 훈련 아래에서 사용자 패턴만 사용 옵션을 선택합니다.

참고: 내장 및 사용자 패턴 사용을 선택하면 ABBYY FineReader 12가 OCR의 기본 사전 설정 패턴과 사용자 패턴을 모두 사용합니다.

  1. 패턴 편집기… 단추를 클릭합니다.
  2. 패턴 편집기 대화 상자에서 원하는 패턴을 선택한 다음 확인을 클릭합니다.
  3. ABBYY FineReader 주 창에서 읽기 단추를 클릭합니다.

사용자 패턴 만들기 및 훈련

새 문자와 결합문자를 인식하도록 사용자 패턴을 훈련시키려면:

  1. 옵션 대화 상자(도구 > 옵션…)를 열고 인식 탭을 클릭합니다.
  2. 훈련 아래에서 내장 및 사용자 패턴 사용 또는 사용자 패턴만 사용을 선택합니다.
  3. 훈련을 포함하여 읽기 옵션을 선택합니다.
  4. 패턴 편집기… 단추를 클릭합니다.

참고: 아시아 언어에는 패턴 훈련이 지원되지 않습니다.

  1. 패턴 편집기 대화 상자에서 새로 만들기…를 클릭합니다.
  2. 패턴 만들기 대화 상자가 열립니다. 사용자 패턴 이름을 입력하고 확인을 클릭합니다.
  3. 패턴 편집기옵션 대화 상자 각각에서 확인 단추를 클릭하여 대화 상자를 닫습니다.
  4. 이미지 창 상단에 있는 도구 모음에서 읽기를 클릭합니다.

이제 ABBYY FineReader가 알 수 없는 문자를 발견하면 패턴 훈련 대화 상자에 이 문자가 표시됩니다.

  1. 프로그램이 새 문자결합문자를 읽을 수 있도록 훈련시킵니다.

결합문자는 "함께 결합"되는 2 - 3개 문자의 조합(예: fi, fl, ffi 등)으로 프로그램이 구분하기 어렵습니다. 실제로 이러한 문자를 단일 결합 문자로 간주하면 보다 정확한 결과를 얻을 수 있습니다.

참고: 효과 아래에서 해당 옵션을 선택하여 위 첨자/아래 첨자의 텍스트 또는 단어에서 굵거나 기울임체로 인쇄되는 단어를 인식 텍스트로 유지할 수 있습니다.

이전에 훈련된 문자로 돌아가려면 뒤로 단추를 클릭합니다. 프레임은 이전 위치로 건너뛰며 가장 최근에 훈련된 "문자 이미지 - 키워드 문자"에 해당하는 항목이 패턴에서 제거됩니다. 뒤로 단추는 단일 단어의 문자 사이를 탐색하며 단어 사이는 탐색하지 않습니다.

중요!

  • ABBYY FineReader가 인식 언어의 자모에 포함된 문자만 읽도록 훈련시킬 수 있습니다. 프로그램이 키보드에서 입력할 수 없는 문자를 읽도록 훈련시키려면 두 문자의 조합을 사용하여 존재하지 않는 해당 문자를 표시하거나 문자 삽입 대화 상자(대화 상자를 열려면   클릭)에서 원하는 문자를 복사합니다.
  • 각 패턴마다 최대 1,000개 새 문자가 포함될 수 있습니다. 그러나 결합문자를 너무 많이 만들면 OCR 품질에 부정적인 영향을 줄 수 있으므로 유의합니다.

사용자 패턴 선택

ABBYY FineReader에서 패턴을 사용하여 OCR 품질을 향상시킬 수 있습니다.

  1. 도구 메뉴에서 패턴 편집기…를 클릭합니다.
  2. 패턴 편집기 대화 상자의 사용 가능한 패턴 목록에서 원하는 패턴을 선택하고 활성으로 설정을 클릭합니다.

주요 참조 사항:

  1. ABBYY FineReader는 유사하지만 다른 문자를 구분하지 않고 동일한 단일 문자로 인식합니다. 예를 들어, 곧은('), 왼쪽(‘) 및 오른쪽(’) 인용 부호는 패턴에서 단일 문자(곧은 인용 부호)로 저장됩니다. 이는 훈련을 시도하더라도 인식된 텍스트에서 왼쪽 및 오른쪽 인용 부호가 사용되지 않음을 의미합니다.
  2. 일부 문자 이미지의 경우 ABBYY FineReader는 주변 컨텍스트를 기반으로 해당 키보드 문자를 선택합니다. 예를 들어, 작은 원 이미지의 경우 바로 옆에 문자가 있으면 문자 O로 인식되고 옆에 숫자가 있으면 숫자 0으로 인식됩니다.
  3. 패턴은 글꼴, 글꼴 크기 및 해상도가 패턴을 만드는 데 사용되는 문서와 같은 문서에만 사용할 수 있습니다.
  4. 패턴을 나중에 사용하려면 파일에 저장합니다. 자세한 내용은 "FineReader 문서란 무엇입니까?"를 참조하십시오.
  5. 다른 글꼴로 설정된 텍스트를 인식하려면 내장 패턴만 사용(도구 >옵션… > 인식) 옵션을 선택하여 사용자 패턴을 비활성화해야 합니다.

사용자 패턴 편집

OCR 프로세스를 시작하기 전에 새로 만든 패턴을 편집할 수 있습니다. 잘못 훈련된 패턴은 OCR 품질에 부정적인 영향을 줄 수 있습니다. 패턴에는 전체 문자 또는 결합문자만 포함되어야 합니다. 가장자리가 잘린 문자와 문자(letter)가 일치하지 않는 문자는 패턴에서 제거해야 합니다.

  1. 도구 메뉴에서 패턴 편집기…를 클릭합니다.
  2. 패턴 편집기 대화 상자가 열립니다. 원하는 패턴을 선택하고 편집… 단추를 클릭합니다.
  3. 사용자 패턴 대화 상자가 열리면 문자를 선택하고 속성… 단추를 클릭합니다.

대화 상자가 열리면 다음 작업을 수행합니다.

  • 문자 필드에서 문자에 해당하는 문자(letter)를 입력합니다.
  • 효과 필드에서 원하는 글꼴 효과(굵게, 기울임꼴, 위 첨자 및 아래 첨자)를 지정합니다.

사용자 패턴 대화 상자에서 삭제 단추를 클릭하여 잘못 훈련된 문자를 삭제합니다.

14.01.2020 17:26:20


Please leave your feedback about this article