Características del documento a considerar antes del OCR

La calidad de las imágenes tiene un efecto significativo en la calidad el reconocimiento. Esta sección explica qué factores debería tener en cuenta antes de reconocer las imágenes:

Idiomas de documento

ABBYY FineReader reconoce los documentos en un único idioma y en varios idiomas (por ejemplo, los escritos en dos o más idiomas). En el caso de documentos multilingües, deberá seleccionar varios idiomas de reconocimiento.

Para especificar un idioma OCR para el documento, en la lista desplegable Idioma del documento de la barra de herramientas principal o en la ventana Tarea, seleccione una de las siguientes opciones:

  • Selección automática

ABBYY FineReader seleccionará automáticamente los idiomas pertinentes a partir de la lista de idiomas definida por el usuario. Para modificar esta lista:

  1. Seleccione Más idiomas…
  2. En el cuadro de diálogo Editor de idiomas, seleccione la opción Seleccionar automáticamente los idiomas del documento de la siguiente lista.
  3. Haga clic en el botón Especificar….
  4. En el cuadro de diálogo Idiomas, seleccione los idiomas deseados.
  • Un idioma o una combinación de idiomas

Seleccione un idioma o una combinación de idiomas. La lista de idiomas incluye los idiomas más utilizados recientemente, junto con inglés, alemán y francés.

  • Más idiomas…

Seleccione esta opción si el idioma que necesita no figura en la lista.

En el cuadro de diálogo Editor de idiomas, seleccione la opción Especificar idiomas manualmente y, a continuación, los idiomas deseados marcando las casillas correspondientes. Si suele utilizar una combinación de idiomas, puede crear un nuevo grupo para estos idiomas.

Si un idioma no está en la lista, puede ser que:

  1. El idioma no sea compatible con ABBYY FineReader.

Para obtener una lista completa de los idiomas compatibles, consulte "Idiomas compatibles."

  1. El idioma no sea compatible con su versión del programa.

Puede encontrar la lista completa de idiomas disponibles con su versión en el cuadro de diálogo Licencias (Ayuda > Acerca de… > Información de licencia).

Además de usar idiomas integrados y grupos de idiomas, puede crear el suyo propio. Para obtener más información, consulte "Si el programa no reconoce algunos de los caracteres."

Tipo de impresión

Los documentos pueden imprimirse en varios dispositivos como máquinas de escribir y máquinas de fax. La calidad del OCR puede mejorarse seleccionando el Tipo de documento correcto en el cuadro de diálogo Opciones.

En la mayoría de los documentos, el programa detectará el tipo de impresión automáticamente. Para la detección automática del tipo de impresión, debe seleccionarse la opción Automático en Tipo de documento en el cuadro de diálogo Opciones (Herramientas > Opciones…). Puede procesar el documento en modo a todo color o en blanco y negro.

También puede optar por seleccionar manualmente el tipo de impresión necesario.

Ejemplo de un texto mecanografiado. Todas las letras tienen el mismo ancho (compare por ejemplo, "w" y "t"). Para textos de este tipo, seleccione Máquina de escribir.
Ejemplo de texto generado mediante un fax. Como puede apreciarse, las letras no son muy nítidas en algunos puntos, además del ruido y la distorsión. Para textos de este tipo, seleccione Fax.

Consejo: tras reconocer textos escritos a máquina o faxes, asegúrese de seleccionar Automático antes de procesar documentos impresos normales.

Calidad de impresión

Es posible que documentos de baja calidad con "ruido" (es decir, puntos negros aleatorios o manchas), letras borrosas o irregulares, líneas inclinadas y bordes de tablas desplazados, requieran una configuración de digitalización específica.

Fax Periódico

Los documentos de baja calidad se digitalizan mejor en escala de grises. Cuando se digitaliza en escala de grises, el programa seleccionará automáticamente el valor de brillo óptimo.

El modo de digitalización en escala de grises conserva más información acerca de las letras del texto digitalizado con el fin de obtener mejores resultados del OCR al reconocer documentos de calidad media a baja. También puede corregir algunos de los defectos manualmente usando las herramientas de edición de imágenes disponibles en el Editor de imágenes. Para obtener más información, consulte "Preprocesamiento de imágenes."

Modo de color

Si no necesita conservar los colores originales de un documento a todo color, puede procesar el documento en modo blanco y negro. Así, reducirá en gran medida el tamaño del documento de ABBYY FineReader resultante y la velocidad del proceso de OCR. Sin embargo, procesar imágenes en blanco y negro de bajo contraste puede resultar en un OCR de baja calidad. No recomendamos el procesamiento en blanco y negro para fotografías, páginas de revistas y textos en chino, japonés y coreano.

Nota: también puede acelerar el reconocimiento de documentos en color y blanco y negro seleccionando la opción Lectura rápida en la pestaña Leer en el cuadro de diálogo Opciones. Para obtener más información sobre los modos de reconocimiento, consulte Opciones de OCR.

Para seleccionar un modo de color, realice una de las acciones siguientes:

  • Utilice la lista desplegable Modo de color en el cuadro de diálogo Tarea, o
  • Seleccione una de las opciones en Modo de color en la pestaña Documento del cuadro de diálogo Opciones (Herramientas > Opciones…).

Importante: una vez que se haya convertido el documento a blanco y negro, no podrá restaurar los colores. Para obtener un documento en color, abra el archivo con imágenes en color o digitalice el documento en papel en modo de color.

1/14/2020 5:26:19 PM


Please leave your feedback about this article