Boîte de dialogue HTML

Cette boîte de dialogue vous permet de spécifier les paramètres du format HTML.

Définissez les paramètres d'enregistrement du texte reconnu au format PDF.

Nom de l’option Description de l’option
Groupe Conserver la mise en page

Conserver la mise en page

(liste déroulante)

Définit la conservation de la présentation. Vous avez le choix entre les options suivantes :

  • Conserver la mise en page
    Sélectionnez cette option si vous voulez que les résultats de la reconnaissance aient le même aspect que l'original.
  • Conserver le type et la taille de la police
    Sélectionnez cette option si vous souhaitez conserver uniquement le type et la taille de la police. La mise en forme du texte dans les paragraphes n'est alors par conservée.
  • Supprimer tout le formatage
    Choisissez cette option si vous avez besoin uniquement du contenu du document original, sans la présentation initiale.
Conserver les images

Sélectionnez cette option pour conserver les images dans le texte reconnu.
Cette option est activée par défaut.

Note. Le format utilisé pour enregistrer les images dans le fichier de sortie est automatiquement sélectionné en fonction des deux propriétés d'image : le type de couleur (noir et blanc, niveaux de gris ou couleur) et le nombre de couleurs (faible ou élevé). Les images en noir et blanc sont toujours enregistrées au format PNG. Les images en niveaux de gris ou en couleur sont enregistrées au format PNG si le nombre de couleurs est faible et au format JPEG si le nombre de couleurs est élevé.

Groupe Format
Utiliser CSS Si vous sélectionnez cette option, la feuille de style intégrée est utilisée. Internet Explorer 4.0 ou supérieur est nécessaire pour afficher un document enregistré dans ce mode.
Conserver les en-têtes et pieds de page

Si le document source contient un en-tête et/ou un pied de page, la sélection de cette option ajoutera l'en-tête en haut de la page et le pied de page en bas de la page. Si cette option n'est pas sélectionnée, l'en-tête et le pied de page ne seront pas ajoutés. Cette option est utile si vous souhaitez omettre la numérotation de votre document d'une seule page.

Note. Cette option est activée par défaut.

Groupe Codage des caractères

Type de codage 

(liste déroulante)

Spécifie le type d'encodage du fichier de sortie :

  • Simple
    Encodage simple, un octet par symbole.
  • Unicode UTF-16
    Format Unicode natif où chaque symbole est représenté par une séquence de deux octets.
  • Unicode UTF-8
    Format Unicode UTF-8. Ce format est une page de code qui utilise une chaîne d'octets pour représenter une chaîne Unicode 16 bits. Le texte ASCII (<=U+007F) reste inchangé sous forme d'octet unique, U+0080-07FF (Latin, Grec, Cyrillique, Hébreu et Arabe) est converti en séquences de 2 octets et U+0800-FFFF (Chinois, Japonais, Coréen et autres) est converti en séquences de 3 octets.

Page de code 

(liste déroulante)

Par défaut, l'application détecte automatiquement la page de code. Sélectionnez la valeur (Automatique) pour utiliser la détection automatique. Vous pouvez également choisir la page de code manuellement dans la liste, si nécessaire.
Supprimer les métadonnées existantes du document Supprime les métadonnées originales du document, notamment le titre, l'auteur, les balises, etc.

Voir également

Boîte de dialogue Paramètres du format de sortie

26.03.2024 13:49:50

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.