Cuadro de diálogo HTML

Esta ficha le permite especificar la configuración del formato HTML.

Establezca los parámetros para guardar el texto reconocido en un archivo HTML:

Nombre de la opción Descripción de la opción
Grupo Conservar diseño de página

Conservar diseño de página

(lista desplegable)

Establece la conservación del diseño. Puede elegir entre las siguientes opciones:

  • Conservar diseño completo de la página
    Seleccione esta opción si desea que los resultados de reconocimiento tengan exactamente el mismo aspecto que el documento original.
  • Conservar fuente y tamaño de fuente
    Esta opción conservará los tipos y tamaños de fuentes y párrafos. No se conservará el formato del texto dentro de los párrafos.
  • Quitar todos los formatos
    Seleccione esta opción si necesita el contenido del documento original pero no necesita conservar el diseño del documento.
Conservar imágenes

Seleccione esta opción para conservar las imágenes en el texto reconocido.

La opción está configurada de forma predeterminada.

Nota. El formato en el cual se guardan las imágenes en el archivo de salida se selecciona automáticamente en base a las propiedades de las dos imágenes: Tipo de color (blanco y negro, escala de grises o color) y variedad de colores (alta o baja). Las imágenes en blanco y negro siempre se guardan en formato PNG. Las imágenes en escala de grises y a color se guardan en formato PNG en el caso de variedad de colores baja y en formato JPEG en el caso de variedad de colores alta.

Grupo Formato
Usar CSS Si selecciona esta opción, se utiliza una hoja de estilo incorporada. Se necesita Internet Explorer 4.0 o posterior para visualizar un documento guardado en este modo.
Conservar encabezados y pies de página

Si el documento fuente contiene un encabezado y/o un pie de página, al seleccionar esta opción se añadirá el encabezado en la parte superior de la página y el pie de página en la parte inferior. Si esta opción no está seleccionada, no se añadirán ni el encabezado ni el pie de página. Esta opción es útil para los documentos con numeración de páginas que usted desee omitir en un documento de una sola página.

Nota. Esta opción está habilitada por defecto.

Grupo Codificación de caracteres

Tipo de codificación

(lista desplegable)

Especifica el tipo de codificación del archivo de salida:

  • Simple
    Codificación simple, un byte por símbolo.
  • Unicode UTF-16
    Formato Unicode nativo en el cual cada símbolo está representado por una secuencia de dos bytes.
  • Unicode UTF-8
    Formato Unicode UTF-8. UTF-8 es una página de código que usa una cadena de bytes para representar una cadena Unicode de 16 bits donde el texto ASCII (<=U+007F) permanece intacto como un byte único, U+0080-07FF (que incluye latín, griego, cirílico, hebreo y árabe) se convierte a una secuencia de 2 bytes y U+0800-FFFF (chino, japonés, coreano y otros) se convierte en una secuencia de 3 bytes.

Página de código

(lista desplegable)

La página de código se detecta automáticamente de forma predeterminada. Seleccione el valor (Automático) para usar la detección automática. Aún así, puede seleccionar la página de código de forma manual si es necesario; simplemente elija el valor necesario de la lista.
Eliminar metadatos de documentos existentes Elimina los metadatos originales del documento, incluidos el título, el autor, las etiquetas, etc.

Consulte también:

Cuadro de diálogo Configuración del formato de salida

26.03.2024 13:49:49

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.