Trabajar con idiomas de escritura compleja

Con ABBYY FineReader, puede reconocer documentos en árabe, hebreo, yiddish, tailandés, chino, japonés y coreano. Deben tenerse en cuenta algunas consideraciones adicionales cuando se trabaja con documentos en chino, japonés o coreano y con documentos en los que se utiliza una combinación de idiomas CJK y europeos.

Instalar compatibilidad de idiomas

Para poder reconocer textos en árabe, hebreo, yiddish, tailandés, chino, japonés y coreano, puede necesitar instalar estos idiomas.

Microsoft Windows 8, Windows 7, y Windows Vista son compatibles con estos idiomas por defecto.

Para instalar nuevos idiomas en Microsoft Windows XP:

  1. Haga clic en Inicio en la barra de tareas.
  2. Haga clic en Panel de control > Opciones regionales y de idiomas.
  3. Haga clic en la pestaña Idiomas y seleccione las siguientes opciones:
    • Instalar archivos para idiomas con escritura compleja y escritos de derecha a izquierda (incluyendo tailandés)

para añadir la compatibilidad con árabe, hebreo, yiddish y tailandés.

  • Instalar archivos para idiomas de Asia oriental

para añadir la compatibilidad con japonés, chino y coreano.

  1. Haga clic en Aceptar.

Fuentes recomendadas

El reconocimiento de texto en árabe, hebreo, yiddish, tailandés, chino, japonés y coreano puede requerir la instalación de fuentes adicionales en Windows. La siguiente tabla enumera las fuentes recomendadas para los textos en estos idiomas.

Idioma de OCR Fuente recomendada
Árabe Arial™ Unicode™ MS*
Hebreo Arial™ Unicode™ MS*
Yiddish Arial™ Unicode™ MS*
Tailandés

Arial™ Unicode™ MS*

Aharoni

David

Levenim mt

Miriam

Narkisim

Rod

Chino (simplificado),

chino (tradicional),

japonés, coreano,

coreano (Hangul)

Arial™ Unicode™ MS*

Fuentes SimSun

como: SimSun (Founder Extended), SimSun-18030, NSimSun

Simhei

YouYuan

PMingLiU

MingLiU

Ming (para ISO 10646)

STSong

* Esta fuente se instala junto con Microsoft Windows XP y Microsoft Office 2000 o posterior.

Las siguientes secciones contienen consejos para mejorar la precisión del reconocimiento.

Desactivar el procesamiento automático

Por defecto, cada página que agregue a un Documento de ABBYY FineReader será automáticamente reconocida.

Sin embargo, si el documento contiene un texto en un idioma CJK combinado con un idioma europeo, le recomendamos deshabilitar la detección automática de orientación de página y usar la opción para dividir páginas duales siempre y cuando todas las imágenes de la página tengan la orientación correcta (es decir, no se hayan digitalizado al revés).

Las opciones Detectar la orientación de la página y Dividir páginas opuestas pueden habilitarse y deshabilitarse en la pestaña Digitalizar/Abrir del cuadro de diálogo Opciones.

Nota: para dividir páginas opuestas en árabe, hebreo o yiddish, asegúrese primero de seleccionar el idioma de reconocimiento correspondiente y, solo entonces, seleccione la opción Dividir páginas opuestas. De este modo, queda garantizado que las páginas se ordenen en el orden correcto. También puede restaurar la numeración original de las páginas seleccionando la opción Intercambiar páginas del libro. Para obtener más información, consulte "¿Qué es un documento de FineReader?"

Si su documento tiene una estructura compleja, recomendamos deshabilitar el análisis automático y el OCR para las imágenes y realizar estas operaciones manualmente.

Para deshabilitar el análisis automático y el OCR:

  1. Abra el cuadro de diálogo Opciones (Herramientas > Opciones…).
  2. Desmarque la opción Procesar automáticamente las páginas a medida que se añaden en la pestaña Digitalizar/Abrir.
  3. Haga clic en Aceptar.

Reconocer documentos escritos en más de un idioma

En las siguientes instrucciones, se toma como ejemplo un documento que contiene texto en inglés y chino.

  1. En la barra de herramientas principal, seleccione Más idiomas… de la lista desplegable Idiomas de documento. Seleccione Especificar idiomas manualmente en el cuadro de diálogo Editor de idiomas y seleccione chino e inglés en la lista de idiomas.
  2. Digitalice o abra las imágenes.
  3. Si el programa no detecta todas las áreas de una imagen:
    • Especifique las áreas manualmente usando las herramientas de edición de área.
    • Especifique cualquier área que sólo contenga un idioma. Para hacerlo, selecciónela y especifique su idioma en el panel Propiedades del área.

Importante: el idioma sólo puede especificarse para las áreas del mismo tipo. Si seleccionó áreas de diferente tipo, como Texto y Tabla, no podrá especificar un idioma.

  1. Haga clic en el botón Leer de la barra de herramientas principal.

Si los caracteres no europeos no se muestran en la ventana Texto

Si el texto en un idioma CJK se muestra incorrectamente en la ventana Texto, puede haber seleccionado el modo Texto sin formato.

Para cambiar la fuente usada en el modo Texto sin formato:

  1. Abra el cuadro de diálogo Opciones (Herramientas > Opciones…).
  2. Haga clic en la pestaña Ver.
  3. Seleccione Arial Unicode MS en la lista desplegable Fuente utilizada para mostrar texto sin formato.
  4. Haga clic en Aceptar.

Si esto no soluciona el problema y el texto en la ventana Texto aún se muestra de forma incorrecta, consulte "Si algunos caracteres se han sustituido con "?" o "□" en la ventana Texto."

Cambiar la dirección del texto reconocido

ABBYY FineReader detecta la dirección del texto automáticamente, pero también se puede especificar la dirección del texto manualmente.

  1. Seleccione uno o más párrafos en la ventana Texto.
  2. Haga clic en el botón en la barra de herramientas Texto.

Nota: puede usar la lista desplegable Dirección del texto CJK en la ventana Imagen para especificar la dirección del texto antes del reconocimiento. Consulte Si no se reconoce el texto vertical o invertido correctamente para obtener más detalles.

14.01.2020 17:26:19


Please leave your feedback about this article