Características del documento que se deben tener en cuenta antes del OCR

La calidad de las imágenes tiene un impacto significativo sobre la calidad del OCR. Esta sección explica qué factores debe tener en cuenta antes de reconocer imágenes.

Idiomas de OCR

ABBYY FineReader puede reconocer documentos en un solo idioma o en varios (por ejemplo, escritos en dos o más idiomas). Para los documentos de varios idiomas, debe seleccionar varios idiomas de OCR.

Para seleccionar idiomas de OCR, haga clic en Opciones > Idiomas y seleccione una de las siguientes opciones:

  • Seleccionar automáticamente los idiomas de OCR de la siguiente lista
    ABBYY FineReader seleccionará automáticamente los idiomas apropiados de la lista de idiomas definida por el usuario. Para editar la lista de idiomas:
    1. Asegúrese de que la Seleccionar automáticamente los idiomas de OCR de la siguiente lista opción está seleccionada.
    2. Haga clic en el Especificar... el botón.
    3. En el Idiomas el cuadro de diálogo, seleccione los idiomas deseados y haga clic en Aceptar.
    4. En el Opciones el cuadro de diálogo, haga clic en Aceptar.
  • Especificar manualmente los idiomas de OCR
    Seleccione esta opción si el idioma que necesita no está en la lista.

En el cuadro de diálogo a continuación, especifique uno o más idiomas. Si utiliza a menudo una combinación de idioma concreta, puede crear un nuevo grupo para estos idiomas.

Si un idioma no está en la lista, puede ser que:

  1. No esté admitido por ABBYY FineReader, o
    Para ver una lista completa de los idiomas admitidos, consulte Idiomas de OCR admitidos.
  2. No compatible con su versión del producto.
    La lista completa de idiomas disponibles en la versión del producto puede encontrarse en el cuadro de diálogo Licencias (haga clic en Ayuda > Acerca de > Información de licencia para abrirlo).

Además de utilizar idiomas integrados y grupos de idiomas, puede crear sus propios idiomas y grupos.Consulte también: Si el programa no reconoce ciertos caracteres.

Tipo de impresión

Se pueden imprimir documentos usando varios dispositivos como máquinas de escribir y máquinas de fax. La calidad del OCR puede variar dependiendo de cómo se imprime el documento. Puede mejorar la calidad del OCR seleccionando el tipo de impresión correcto en el Opciones cuadro de diálogo.

Para la mayoría de los documentos, el programa detectará el tipo de impresión automáticamente. Para la detección automática del tipo de impresión, Automático debe seleccionar la opción en el Tipo de documento grupo de opciones en el Opciones cuadro de diálogo (haga clic en Herramientas > Opciones... > OCR para acceder a estas opciones). Puede procesar documentos en modo a todo color o en blanco y negro.

También puede seleccionar manualmente el tipo de impresión según sea necesario.

Un ejemplo de texto mecanografiado. Todas las letras son de igual anchura (comparar, por ejemplo, "w" y "t"). Para los textos de este tipo, seleccione Máquina de escribir.
Un ejemplo de un texto producido por una máquina de fax. Como se puede ver en el ejemplo, las letras no son claras en algunos lugares. También hay algo de ruido y distorsión. Para los textos de este tipo, seleccione Fax.

Después de reconocer textos mecanografiados o faxes, asegúrese de seleccionar Automático antes de procesar documentos impresos regularmente.

Calidad de impresión

Es posible que documentos de baja calidad con "ruido" (esto es, puntos negros aleatorios o manchas), letras borrosas o irregulares, líneas inclinadas y bordes de tablas desplazados requieran una configuración de digitalización específica.

Fax Periódico

Los documentos de baja calidad se digitalizan mejor en escala de grises. Cuando digitalice en escala de grises, el programa seleccionará el valor óptimo de brillo automáticamente.

El modo de digitalización en escala de grises conserva más información acerca de las letras del texto digitalizado con el fin de obtener mejores resultados del OCR al reconocer documentos de calidad media a baja. También puede corregir algunos de los defectos manualmente usando las herramientas de edición de imágenes disponibles en el Editor de imágenes. Consulte también: Si la imagen del documento tiene defectos y la precisión del OCR es baja.

Modo de color

Si no necesita conservar los colores originales de un documento a todo color, puede procesar el documento en modo en blanco y negro. Esto reducirá enormemente el tamaño del proyecto OCR resultante y acelerará el proceso OCR. Sin embargo, el procesamiento de imágenes de bajo contraste en blanco y negro puede resultar en una baja calidad de OCR. No recomendamos el procesamiento en blanco y negro para fotos, páginas de revistas y textos en chino, japonés y coreano.

Consejo. Puede acelerar el OCR de documentos en color y en blanco y negro seleccionando Reconocimiento rápido en la OCR pestaña del Opciones cuadro de diálogo. Para obtener más información sobre los modos de reconocimiento, consulte Opciones de OCR.

Para ver algunas recomendaciones adicionales sobre cómo seleccionar el modo de color correcto, consulte Consejos para digitalizar.

Una vez que el documento se convierte en blanco y negro, no podrá restaurar los colores. Para obtener un documento en color, abra un archivo con imágenes en color o digitalice un documento en papel en modo de color.

02.11.2018 16:19:20


Please leave your feedback about this article