Créer une langue utilisateur
Le poste de vérification utilise des données relatives à la langue du document lors de la reconnaissance du texte. Il est possible que le programme ne parvienne pas à reconnaître certains caractères dans les documents comportant des éléments peu ordinaires (par ex. : les numéros de code) car la langue du document est susceptible de ne pas contenir ces caractères. Pour reconnaître ces documents, vous pouvez créer une langue personnalisée incluant tous les caractères nécessaires. Vous pouvez également créer des groupes de plusieurs langues d'OCR et utiliser ces groupes lors de la reconnaissance de documents.
- Dans le menu Outils, cliquez sur Éditeur de langues....
- Cliquez sur Nouveau... le bouton.
- Dans la boîte de dialogue qui s'ouvre, sélectionnez Créer une nouvelle langue basée sur une langue existante l'option, sélectionnez la langue que vous souhaitez utiliser en tant que base pour la nouvelle langue, puis cliquez sur OK.
- La Propriétés de la langue boîte de dialogue s'ouvre. Dans cette boîte de dialogue :
- Saisissez un nom pour votre nouvelle langue.
- La langue que vous avez sélectionnée dans Nouvelle langue ou nouveau groupe de langues la boîte de dialogue s'affiche dans Langue source la liste déroulante. Vous pouvez sélectionner une langue différente à partir de cette liste déroulante.
- Le Alphabet contient l'alphabet de la langue de base. Si vous souhaitez éditer l'alphabet, cliquez sur le bouton.
- L'option Dictionnaire contient plusieurs options pour le dictionnaire à utiliser par le programme lors de la reconnaissance du texte et de la vérification du résultat :
- Aucun
La langue n'aura pas de dictionnaire. - Dictionnaire intégré
Le dictionnaire intégré du programme sera utilisé. - Dictionnaire utilisateur
Cliquez sur Édition... le bouton pour spécifier les termes du dictionnaire ou importer un dictionnaire personnalisé existant ou un fichier texte avec le codage Windows-1252 (les termes doivent être séparés par des espaces ou d'autres caractères absents de l'alphabet).
Les mots provenant du dictionnaire utilisateur ne seront pas signalés comme mal orthographiés lorsque la vérification orthographique du texte reconnu sera effectuée. Ils pourront être écrits tout en majuscules ou minuscules ou encore commencer par une majuscule.
Mot dans le dictionnaire | Mots qui ne seront pas considérés comme mal orthographiés lors de la vérification de l'orthographe |
abc | abc, Abc, ABC |
Abc | abc, Abc, ABC |
ABC | abc, Abc, ABC |
Abc | aBc, abc, Abc, ABC |
- Le Expression régulière vous permet de créer un dictionnaire utilisateur par l'usage d'expressions régulières.
Consultez également : Expressions régulières.
- Les langues peuvent avoir plusieurs propriétés supplémentaires. Pour modifier ces propriétés, cliquez sur Avancé... le bouton pour ouvrir la Propriétés avancées des langues boîte de dialogue dans laquelle vous pouvez spécifier :
- Les caractères commençant ou terminant un mot
- Les caractères non alphabétiques ne figurant pas dans les mots
- Les caractères pouvant figurer dans les mots mais devant être ignorés
- Les caractères ne pouvant pas figurer dans les textes reconnus utilisant cette langue (caractères interdits)
- L' Le texte peut contenir des chiffres arabes, des chiffres romains et des abréviations option
- Vous pouvez à présent sélectionner la nouvelle langue créée lors du choix des langues d'OCR.
Vous pouvez également enregistrer tous les gabarits et langues utilisateur dans un fichier unique. Pour cela,ouvrez Options la boîte de dialogue (cliquez sur Outils > Options... pour ouvrir cette boîte de dialogue), cliquez sur le bouton OCR l'onglet, puis cliquez sur le bouton Enregistrer les gabarits et langues....
Si vous vous apprêtez à utiliser régulièrement une combinaison particulière de langues, vous jugerez certainement plus pratique de grouper les langues ensemble.
- Ouvrez Options la boîte de dialogue (cliquez sur Outils > Options... pour ouvrir cette boîte de dialogue) et cliquez sur l'onglet Langues.
- Cliquez sur Nouveau... le bouton.
- Dans la fenêtre Nouvelle langue ou nouveau groupe de langues la boîte de dialogue, sélectionnez Créer un nouveau groupe de langues l'option puis cliquez sur OK.
- La Propriétés du groupe de langues boîte de dialogue s'ouvre. Dans cette boîte de dialogue, spécifiez un nom pour le groupe de langue et sélectionnez les langues que vous souhaitez y inclure.
Si vous savez que votre texte ne contiendra pas certains caractères, vous souhaiterez peut-être spécifier explicitement ces caractères interdits. Ceci peut augmenter la vitesse et la précision de l'OCR. Pour spécifier ces caractères, cliquez sur Avancé... le bouton dans Propriétés du groupe de langues la boîte de dialogue et saisissez les caractères interdits dans Caractères interdits le champ. - Cliquez sur OK.
Le nouveau groupe figurera dans la liste déroulante des langues sur la barre d'outils principale.
Vous pouvez également enregistrer tous les gabarits et langues utilisateur dans un fichier unique. Pour cela, cliquez sur Outils > Enregistrer les gabarits et les langues....
3/26/2024 1:49:51 PM