Si votre document imprimé contient des polices non standard

Le mode Apprentissage permet d'améliorer la qualité de la reconnaissance optique de caractères des documents contenant des polices décoratives ou des caractères spéciaux (par exemple des symboles mathématiques).

Remarque : il est déconseillé d'utiliser le mode Apprentissage dans d'autres cas, car les gains en qualité de reconnaissance seront insignifiants comparé au temps et aux efforts que vous devrez consacrer à l'apprentissage.

En mode Apprentissage, un gabarit est créé. Ce dernier est utilisé lors de l'exécution de l'OCR sur tout le texte.

Utilisation de gabarits utilisateur

Pour utiliser un gabarit pour la reconnaissance d'un document :

  1. Ouvrez la boîte de dialogue Options (Outils > Options…), puis cliquez sur l'onglet Lire.
  2. Sous Apprentissage, sélectionnez l'option N'utiliser que le gabarit utilisateur.

Remarque : si vous sélectionnez Utiliser les gabarits intégrés et les gabarits utilisateur, ABBYY FineReader 12 utilise les gabarits utilisateur et les gabarits intégrés pour l'OCR.

  1. Cliquez sur le bouton Éditeur de gabarit….
  2. Dans la boîte de dialogue Éditeur de gabarits, sélectionnez le gabarit souhaité, puis cliquez sur OK.
  3. Dans la fenêtre principale d'ABBYY FineReader, cliquez sur le bouton Lire.

Création et apprentissage d'un gabarit utilisateur

Pour qu'un gabarit utilisateur apprenne à reconnaître de nouveaux caractères et de nouvelles ligatures :

  1. Ouvrez la boîte de dialogue Options (Outils > Options…), puis cliquez sur l'onglet Lire.
  2. Sous Apprentissage, sélectionnez Utiliser les gabarits intégrés et les gabarits utilisateur ou N'utiliser que le gabarit utilisateur.
  3. Sélectionnez l'option Lire avec apprentissage.
  4. Cliquez sur le bouton Éditeur de gabarit….

Remarque : l''apprentissage de gabarit n'est pas pris en charge pour les langues asiatiques.

  1. Dans la boîte de dialogue Éditeur de gabarits, cliquez sur Nouveau…
  2. La boîte de dialogue Créer un gabarit s'ouvre. Saisissez le nom du gabarit utilisateur, puis cliquez sur OK.
  3. Fermez les boîtes de dialogue Éditeur de gabarits et Options en cliquant sur le bouton OK de chacune d'entre elles.
  4. Dans la barre d'outils située en haut de la fenêtre Image, cliquez sur Lire.

Maintenant, si ABBYY FineReader rencontre un caractère incertain, ce caractère sera affiché dans une boîte de dialogue Apprentissage du gabarit.

  1. Apprenez au programme à lire de nouveaux caractères et de nouvelles ligatures.

Une ligature est une combinaison de deux ou trois caractères "collés" (par exemple, fi, fl, ffi, etc.) ; il est difficile de les séparer pour le programme. En réalité, vous pouvez obtenir de meilleurs résultats en les considérant comme caractères composés uniques.

Remarque : les mots imprimés en gras ou en italique de votre texte ou les mots en exposant/indice peuvent être conservés dans le texte reconnu en sélectionnant les options correspondantes dans Effets.

Pour revenir au caractère précédemment appris, cliquez sur le bouton Retour. Le cadre reviendra à son emplacement précédent et à la dernière association"image de caractère – caractère clavier" apprise sera supprimée du gabarit. Le bouton Retour parcourt les caractères d'un seul mot et ne parcourra pas les mots un à un.

Important !

  • ABBYY FineReader ne peut apprendre à lire que les caractères inclus dans l'alphabet de la langue de reconnaissance. Pour que le programme apprenne à lire des caractères ne pouvant pas être saisis au clavier, utilisez une combinaison de deux caractères pour identifier ces caractères inexistants ou copiez le caractère souhaité depuis la boîte de dialogue Insérer un caractère (cliquez sur   pour ouvrir cette boîte de dialogue).
  • Chaque gabarit peut contenir un maximum de 1 000 nouveaux caractères. Cependant, évitez de créer trop de ligatures car cela peut nuire à la qualité de la reconnaissance optique de caractères.

Sélection d'un gabarit utilisateur

ABBYY FineReader vous permet d'utiliser des gabarits pour améliorer la qualité de l'OCR

  1. Dans le menu Outils, cliquez sur Éditeur de gabarit….
  2. Dans la boîte de dialogue Éditeur de gabarits, sélectionnez le gabarit souhaité dans la liste des gabarits disponibles et cliquez sur Définir comme actif.

Quelques points importants à ne pas oublier :

  1. Au lieu de différencier les caractères similaires mais cependant distincts, ABBYY FineReader les reconnaît comme étant un seul et même caractère. Par exemple, les guillemets droits ('), d'ouverture (‘) et de fermeture (’) seront stockés dans un gabarit en tant que caractère unique (guillemet droit). Cela signifie que les guillemets d'ouverture et de fermeture ne seront jamais utilisés dans le texte reconnu, même si vous avez tenté leur apprentissage.
  2. Pour les images de certains caractères, ABBYY FineReader sélectionnera le caractère du clavier correspondant en fonction du contexte de l'image. Par exemple, l'image d'un petit cercle sera reconnue comme la lettre O si elle est immédiatement entourée de lettres, ou comme le chiffre 0 si elle est entourée de chiffres.
  3. Un gabarit ne peut être utilisé que pour des documents dotés de la même police, de la même taille de police et de la même résolution que le document utilisé pour créer le gabarit.
  4. Pour pouvoir utiliser un gabarit ultérieurement, enregistrez-le dans un fichier. Pour plus de détails, consultez la section "Qu'est-ce qu'un document FineReader ?.
  5. Pour reconnaître des textes comportant une autre police, assurez-vous de désactiver le gabarit utilisateur en sélectionnant l'option N'utiliser que les gabarits intégrés dans Outils > Options… > Lire.

Modification d'un gabarit utilisateur

Il se peut que vous souhaitiez modifier votre gabarit nouvellement créé avant de lancer le processus d'OCR. Un gabarit qui n'a pas été correctement entraîné peut nuire à la qualité de la reconnaissance optique de caractères. Le gabarit ne doit contenir que des caractères ou des ligatures entiers. Il faut retirer du gabarit les caractères dont les bords sont endommagés et ceux qui sont incorrectement identifiés.

  1. Dans le menu Outils, cliquez sur Éditeur de gabarit….
  2. La boîte de dialogue Éditeur de gabarits s'ouvre. Sélectionnez le gabarit souhaité, puis cliquez sur le bouton Modifier….
  3. Dans la boîte de dialogue Gabarit utilisateur qui s'ouvre, sélectionnez un caractère et cliquez sur le bouton Propriétés….

Dans la boîte de dialogue qui apparaît:

  • Saisissez la lettre correspondant au caractère dans le champ Caractère
  • Spécifiez l'effet de police souhaité (gras, italique, exposant et indice) dans le champ Effet.

Cliquez sur le bouton Supprimer de la boîte de dialogue Gabarit utilisateur pour supprimer un caractère qui a mal été appris.

1/14/2020 5:26:19 PM


Please leave your feedback about this article