Onglet 2. Traitement de la boîte de dialogue Propriétés du workflow

L'onglet 2. Traitement contient les options de reconnaissance.

Nom de l'option Description de l'option
Langues du document Spécifie les langues de reconnaissance. Les langues sont triées par ordre alphabétique et sont réparties en deux groupes. Le premier contient les langues avec dictionnaire, le deuxième contient les langues sans dictionnaire. Consultez la section  Liste des langues de reconnaissance.
Sélectionner la langue automatiquement

Si vous utilisez des langues sélectionnées dans la liste Langues du document, la langue du document sera automatiquement détectée.

Note. La sélection de cette option peut ralentir ABBYY FineReader Server lors du traitement de textes dans des langues autres qu'européennes.

Optimiser l'OCR au niveau de Permet d'optimiser la reconnaissance en fonction de la vitesse ou de la qualité.
Utiliser le dictionnaire personnalisé  Spécifie le chemin d'accès à un dictionnaire personnalisé qui sera utilisé lors de la reconnaissance. Un dictionnaire personnalisé est un fichier texte au format de codage UTF-16, où les mots sont représentés sous forme de liste, chaque ligne contenant un mot.
Mode de traitement 

Spécifie le mode de reconnaissance :

  • Tout le texte (extraire le texte des images)


    Le programme doit reconnaître tous les textes trouvés dans le document, y compris les textes inclus dans les zones d'image.
  • Texte et images (ne pas extraire le texte des images)
    Le programme doit reconnaître tous les textes trouvés dans le document, à l'exception des textes inclus dans les zones d'image.
  • Uniquement les codes-barres
    Sélectionnez ce mode pour n’extraire que les valeurs de codes barre du document.
    • Note. avec cette option, les pages ne comportant pas de codes-barres sont traitées comme des pages blanches.
    • Note. Les codes-barres du type Code 39 sans astérisque ne peuvent pas être reconnus dans ce mode.

Paramètres avancés...

(bouton)

Ouvre la boîte de dialogue Paramètres de traitement avancés.
Mode de traitement de PDF 
  • Automatique
    Les documents d'entrée au format PDF sont analysés et (i) les documents sans couche de texte ainsi que les documents contenant du texte numérisé ou reconnu seront soumis à l'OCR, (ii) les documents avec une couche de texte obtenue à partir d'un fichier Office seront exportés « tels quels. »
  • Toujours utiliser OCR
    Les documents d'entrée au format PDF seront soumis à l'OCR indépendamment de la disponibilité d'une couche de texte.
  • Toujours utiliser le texte contenu dans le fichier PDF
    Les documents d'entrée au format PDF sans couche de texte seront soumis à l'OCR. Les documents avec une couche de texte seront exportés « tels quels. »
Conserver les images et les commentaires originaux dans le PDF numérisé

La couche d'image, les notes et les commentaires d'origine seront conservés dans les fichiers de sortie.

Note. La couche d'image d'origine ne peut être conservée que pour les fichiers JPEG.

Ne pas modifier les fichiers PDF avec signatures numériques Le texte des documents PDF sera soumis à l'OCR, mais les documents originaux resteront intacts et leurs signatures numériques seront préservées.
Mode de traitement des documents Office  Dans la liste déroulante, vous pouvez sélectionner une application Microsoft Office ou LibreOffice à utiliser pour le traitement des documents Office (c.-à-d., les fichiers *.doc, *.docx, *.odt, *.html, *.htm, *.txt, *.rtf; *.xls, *.xlsx, *.ods; *.ppt, *.pptx et *.odp).

Voir également

Boîtes de dialogue Propriétés du workflow

26.03.2024 13:49:50

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.