Ficha 2. Proceso del cuadro de diálogo Propiedades del flujo de trabajo

La ficha 2. Proceso incluye opciones de reconocimiento.

Nombre de la opción Descripción de la opción
Idiomas del documento Especifica los idiomas de reconocimiento. Los idiomas se ordenan alfabéticamente y se dividen en dos grupos: el primero incluye idiomas con acceso total al diccionario, el segundo grupo incluye idiomas sin acceso al diccionario. Consulte Lista de idiomas de reconocimiento.
Seleccionar idioma automáticamente

El idioma del documento se detectará automáticamente usando los idiomas seleccionados en la lista Idiomas del documento.  

Nota. Si selecciona esta opción, es posible que ABBYY FineReader Server se ralentice al procesar textos en idiomas no europeos.

Optimizar OCR para Especifica el modo que optimiza el reconocimiento de calidad o velocidad.
Usar diccionario personalizado Especifica la ruta de un diccionario personalizado que se utilizará durante el reconocimiento. Un diccionario personalizado es un archivo de texto con codificación UTF-16 donde las palabras se representan en forma de lista en la que cada línea contiene una palabra.
Modo de procesamiento

Especifica el modo de reconocimiento:

  • Todo el texto (extraer texto de imágenes)


    El programa reconocerá todo el texto que encuentre en el documento, incluido el contenido en áreas de imagen.
  • Texto e imágenes (no extraer texto de imágenes)
    El programa reconocerá todo el texto, excepto el contenido en áreas de imagen.
  • Solo códigos de barras
    Seleccione este modo si desea extraer sólo valores de códigos de barra del documento.
    • Nota. Con esta opción, las páginas sin códigos de barras se consideran páginas en blanco.
    • Nota. Los códigos de barras de tipo Código 39 sin asterisco no se pueden reconocer en este modo.

Configuración avanzada...

(botón)

Abre el cuadro de diálogo Configuración avanzada de procesamiento.
Modo de procesamiento de PDF
  • Automático
    Los documentos PDF de entrada se analizan: (i) los documentos sin capa de texto y los que tengan texto digitalizado o reconocido se someterán a OCR; (ii) los documentos con capa de texto obtenidos de un archivo de Office se exportarán «tal cual».
  • Usar siempre OCR
    Los documentos PDF de entrada se someterán a OCR independientemente de que haya o no capa de texto.
  • Usar siempre texto de archivo PDF
    Los documentos PDF de entrada sin capa de texto se someterán a OCR. Los documentos con capa de texto se exportarán «tal cual».
Mantener imágenes y comentarios originales en PDF digitalizado

En los archivos de salida se conservarán la capa de imagen, las notas y los comentarios originales.

Nota. La capa original de la imagen solo puede conservarse para los archivos JPEG.

No modificar archivos PDF con firmas digitales El texto de los documentos PDF se someterá a OCR, pero los documentos originales no sufrirán cambios (también se conservará su firma digital).
Modo de procesamiento de documentos de Office En la lista desplegable, puede seleccionar la aplicación de Microsoft Office o LibreOffice que se utilizará para procesar documentos de Office (esto es, archivos *.doc, *.docx, *.odt, *.html, *.htm, *.txt, *.rtf, *.xls, *.xlsx, *.ods, *.ppt, *.pptx y *.odp).

Consulte también:

Cuadro de diálogo Propiedades del flujo de trabajo

26.03.2024 13:49:49

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.