Si le programme ne parvient pas à reconnaître certains caractères

ABBYY FineReader 14 utilise des données concernant la langue du document lors de la reconnaissance du texte. Il est possible que le programme ne parvienne pas à reconnaître certains caractères dans les documents comportant des éléments peu ordinaires (par ex. : les numéros de code) car la langue du document est susceptible de ne pas contenir ces caractères. Pour reconnaître ces documents, vous pouvez créer une langue personnalisée incluant tous les caractères nécessaires. Vous pouvez également créer des groupes de plusieurs langues d'OCR et utiliser ces groupes lors de la reconnaissance de documents.

Comment créer une langue utilisateur

  1. Ouvrez Options la boîte de dialogue (cliquez sur Outils > Options... pour ouvrir cette boîte de dialogue), cliquez sur le bouton Langues.
  2. Cliquez sur Nouveau... le bouton.
  3. Dans la boîte de dialogue qui s'ouvre, sélectionnez Créer une nouvelle langue basée sur une langue existante l'option, sélectionnez la langue que vous souhaitez utiliser en tant que base pour la nouvelle langue, puis cliquez sur OK.
  4. La Propriétés de la langue boîte de dialogue s'ouvre. Dans cette boîte de dialogue :
    1. Saisissez un nom pour votre nouvelle langue.
    2. La langue que vous avez sélectionnée dans Nouvelle langue ou nouveau groupe de langues la boîte de dialogue s'affiche dans Langue source la liste déroulante. Vous pouvez sélectionner une langue différente à partir de cette liste déroulante.
    3. Le Alphabet  contient l'alphabet de la langue de base. Si vous souhaitez éditer l'alphabet, cliquez sur le bouton.
    4. L'option Dictionnaire contient plusieurs options pour le dictionnaire à utiliser par le programme lors de la reconnaissance du texte et de la vérification du résultat :
      • Aucun
        La langue n'aura pas de dictionnaire.
      • Dictionnaire intégré
        Le dictionnaire intégré du programme sera utilisé.
      • Dictionnaire utilisateur
        Cliquez sur Édition... le bouton pour spécifier les termes du dictionnaire ou importer un dictionnaire personnalisé existant ou un fichier texte avec le codage Windows-1252 (les termes doivent être séparés par des espaces ou d'autres caractères absents de l'alphabet).
        Les mots provenant du dictionnaire utilisateur ne seront pas signalés comme mal orthographiés lorsque la vérification orthographique du texte reconnu sera effectuée. Ils pourront être écrits tout en majuscules ou minuscules ou encore commencer par une majuscule.
Mot dans le dictionnaire Mots qui ne seront pas considérés comme mal orthographiés lors de la vérification de l'orthographe
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
Abc aBc, abc, Abc, ABC
  • Le Expression régulière vous permet de créer un dictionnaire utilisateur par l'usage d'expressions régulières.
    Consultez également : Expressions régulières.
  1. Les langues peuvent avoir plusieurs propriétés supplémentaires. Pour modifier ces propriétés, cliquez sur Avancé... le bouton pour ouvrir la Propriétés avancées des langues boîte de dialogue dans laquelle vous pouvez spécifier :
    • Les caractères commençant ou terminant un mot
    • Les caractères non alphabétiques ne figurant pas dans les mots
    • Les caractères pouvant figurer dans les mots mais devant être ignorés
    • Les caractères ne pouvant pas figurer dans les textes reconnus utilisant cette langue (caractères interdits)
    • L' Le texte peut contenir des chiffres arabes, des chiffres romains et des abréviations option
  2. Vous pouvez à présent sélectionner la nouvelle langue créée lors du choix des langues d'OCR.
    Pour plus d'informations concernant les langues d'OCR, consultez Langues d'OCR.

Par défaut, la langue utilisateur est enregistrée dans le dossier du projet d'OCR. Vous pouvez également enregistrer tous les gabarits et langues utilisateur dans un fichier unique. Pour cela,ouvrez Options la boîte de dialogue (cliquez sur Outils > Options... pour ouvrir cette boîte de dialogue), cliquez sur le bouton OCR l'onglet, puis cliquez sur le bouton Enregistrer les gabarits et langues....

Créer un groupe de langues

Si vous vous apprêtez à utiliser régulièrement une combinaison particulière de langues, vous jugerez certainement plus pratique de grouper les langues ensemble.

  1. Ouvrez Options la boîte de dialogue (cliquez sur Outils > Options... pour ouvrir cette boîte de dialogue) et cliquez sur l'onglet Langues.
  2. Cliquez sur Nouveau... le bouton.
  3. Dans la fenêtre Nouvelle langue ou nouveau groupe de langues la boîte de dialogue, sélectionnez Créer un nouveau groupe de langues l'option puis cliquez sur OK.
  4. La Propriétés du groupe de langues boîte de dialogue s'ouvre. Dans cette boîte de dialogue, spécifiez un nom pour le groupe de langue et sélectionnez les langues que vous souhaitez y inclure.
    Si vous savez que votre texte ne contiendra pas certains caractères, vous souhaiterez peut-être spécifier explicitement ces caractères interdits. Ceci peut augmenter la vitesse et la précision de l'OCR. Pour spécifier ces caractères, cliquez sur Avancé... le bouton dans Propriétés du groupe de langues la boîte de dialogue et saisissez les caractères interdits dans Caractères interdits le champ.
  5. Cliquez sur OK.

Le nouveau groupe figurera dans la liste déroulante des langues sur la barre d'outils principale.

Par défaut, les groupes de langues utilisateur sont enregistrés dans le dossier du projet d'OCR. Vous pouvez également enregistrer tous les gabarits et langues utilisateur dans un fichier unique. Pour cela, ouvrez Options la boîte de dialogue (cliquez sur Outils > Options... pour ouvrir cette boîte de dialogue), cliquez sur le bouton OCR l'onglet, puis cliquez sur le bouton Enregistrer les gabarits et langues... le bouton.

Astuce. Vous pouvez utiliser la liste déroulante des langues sur la barre d'outils principale afin de sélectionner un groupe de langues.

  1. Sélectionnez Autres langues... à partir de la liste déroulante des langues dans la barre d'outils principale.
  2. Dans Éditeur de langues la boîte de dialogue, sélectionnez Spécifier manuellement les langues d'OCR  l'option.
  3. Sélectionnez les langues désirées et cliquez sur OK.

02.11.2018 16:19:22


Please leave your feedback about this article