Options de reconnaissance pour les champs de texte

Options de reconnaissance pour les champs de texte Reconnaissance de la boîte de dialogue Propriétés du champ (option Propriétés... du menu contextuel du champ). Lorsque les valeurs des champs sont correctement déterminées, la qualité de la reconnaissance augmente considérablement et le risque d'erreurs diminue.

Dans le champ Type de remplissage, sélectionnez le mode de reconnaissance souhaité : Reconnaissance standard, Ne pas reconnaître ou Reconnaissance par script.

Pour le mode Reconnaissance standard , spécifiez les options suivantes :

  • ICR (manuscrit)  : activez cette option si le texte statique de ce champ est manuscrit.  Le style d'écriture pouvant varier considérablement d'un pays à l'autre, vous devez spécifier le pays concerné.

    Afficher des exemples de styles d'écriture des chiffres

  • OCR (imprimé)   : activez cette option si le texte statique de ce champ est imprimé. Sélectionnez le style d'impression dans la liste déroulante (typographique, imprimante matricielle, machine à écrire, etc.). Consultez aussi la section Types de textes pris en charge.
  • Avancé  utilisez cette option pour sélectionner plusieurs types de textes ou pour spécifier un type de texte personnalisé. Cette option vous permet de charger un fichier de gabarit au format *.ptn. Vous pouvez créer un gabarit utilisateur sous ABBYY FineReader Professional/Corporate Edition 9.0 (ou dans une version antérieure) ou sous ABBYY FineReader Engine 9.0 (ou dans une version antérieure).


Gabarit

Pour charger un gabarit, cliquez sur Modifier.... Dans la boîte de dialogue qui s'ouvre, sélectionnez  Utilisation de gabarit  puis spécifiez le chemin du fichier.

  • Type de marquage  : sélectionnez le type de marquage ; pour simplifier votre choix, sélectionnez des exemples dans la liste déroulante. Si le marquage disparaît pendant la numérisation, votre type de marquage aura un espacement fixe (cases grises). Si le marquage ne disparaît pas pendant la numérisation et s'il est subdivisé en cellules pour les espacements entre les caractères, vous devez saisir le nombre total de cellules. Lorsque le programme détecte automatiquement les champs comportant un tel marquage, le nombre de cellules est automatiquement déterminé.
  • Casse   : sélectionnez la casse des lettres du champ. Si le champ peut contenir à la fois des majuscules et des minuscules, laissez l'option Automatique activée.
  • Orientation  : spécifiez l'orientation du texte.
  • Direction of CJK text - sélectionnez le sens de lecture à utiliser pour l'OCR des textes en chinois, japonais ou coréen. Les options possibles sont Auto, Horizontal Script, ou Vertical Script. Auto est sélectionné par défaut et est l'option recommandée pour les champs qui ne contiennent pas de texte en chinois, japonais ou coréen.
  • Activez l'option Une ligne pour les champs d'une ligne.
  • Pour les champs dont la valeur est toujours composée d'un seul mot, activez l'option Un mot. Sélectionnez cette option si vous souhaitez appliquer une expression régulière à l'intégralité du champ, quel que soit le nombre de mots qui s'y trouve.
    Remarque :Lorsque l'option Un mot est activée, il est déconseillé d'avoir dans le dictionnaire personnalisé des expressions avec un espace.

Configurez les options de traitement d'images pendant la reconnaissance :

  • Inverser inverse les couleurs et la luminosité de l'image pendant la reconnaissance (cette inversion est temporaire et n'affecte que la reconnaissance ; les couleurs d'origine de l'image seront maintenues dans le ficher de sortie).
    • Autodetect détecte automatiquement la couleur du texte et la couleur d'arrière-plan et les inverse le cas échéant. Il s'agit du paramètre recommandé pour les documents qui contiennent à la fois un texte clair sur un fond sombre et un texte sombre sur un fond clair.
    • Inverser inverse complètement les images.
    • Ne pas inverser maintient les couleurs d'origine (cette option est activée par défaut).
  • Supprimer la texture : supprime la texture.
  • Nettoyer : supprime les éléments parasites de l'image.
  • Vider la corbeille de la taille spécifiée uniquement  : n'activez cette option que pour supprimer les éléments parasites de la taille spécifiée. Spécifiez la taille des éléments parasites. Si cette option est désactivée et si seule l'option Nettoyer est activée, la taille des éléments parasites sera sélectionnée automatiquement.

Sélectionnez le mode Ne pas reconnaître si le champ ne peut pas être reconnu pour certaines raisons (par exemple, si le texte du champ comporte des lettres qui se chevauchent) et si l'opérateur doit saisir sa valeur manuellement. Dans ce cas, il ne vous est pas nécessaire de configurer les autres propriétés de reconnaissance car ce champ ne sera pas reconnu ; l'opérateur sera invité à saisir la valeur du champ pendant la vérification.

Sélectionnez le mode Reconnaissance par script si vous souhaitez utiliser un algorithme d'initialisation ou de reconnaissance personnalisé. Pour plus de détails, consultez la section Script de reconnaissance personnalisée.

14.01.2021 14:17:20


Please leave your feedback about this article