Glossaire

A

Analyse de document désigne le processus d'identification de la structure logique d'un document et des zones contenant divers types de données. L'analyse de document peut être effectuée automatiquement ou manuellement.

Apprentissage désigne le processus d'établissement d'une correspondance entre l'image d'un caractère et le caractère en lui-même. Consultez également : Si votre document imprimé contient des polices non standard.

Attributs des polices désigne l'apparence d'une police (par exemple, gras, italique, souligné, barré, exposant, indice, minuscules).

C

Caractères ignorés désigne des caractères autres que des lettres détectés dans les mots (par exemple les caractères syllabiques ou les accents). Ces caractères sont ignorés au cours d'une vérification orthographique.

Caractères incertains désigne des caractères n'ayant peut-être pas été reconnus correctement par le programme.

Caractères interdits désigne les caractères que vous imaginez ne jamais apparaître dans un texte à reconnaître. Spécifier les caractères interdits augmente la vitesse et la qualité de la reconnaissance optique de caractères.

Retour en haut de la page

E

En-têtes et pieds de page désignent les images ou le texte situés dans la marge supérieure ou inférieure d'une page. Les en-têtes se situent en haut de la page et les pieds de page en bas de la page.

F

Forme de base désigne la forme « dictionnaire » d'un mot (les entrées de dictionnaires sont généralement données dans leurs formes de base).

I

Image inversée désigne une image contenant des caractères blancs sur un arrière-plan sombre.

L

Ligature désigne une combinaison d'au moins deux caractères « collés » ensemble (par exemple, fi, fl, ffi). Il est difficile pour LE poste de vérification de séparer ce type de caractères. Les traiter en tant que caractère unique améliore la précision de l'OCR.

Retour en haut de la page

M

Menu de raccourcis désigne un menu apparaissant lorsque vous effectuez un clic droit sur un objet, par exemple, une zone ou un autre élément du document.

Mise en page désigne la disposition du texte, des tableaux, des images, des paragraphes et des colonnes dans une page. Les polices, les tailles de police, les couleurs de police, l'arrière-plan du texte et l'orientation du texte font également partie de la mise en page.

Mode de numérisation désigne un paramètre de numérisation qui détermine si une image doit être numérisée en noir et blanc, en niveau de gris ou en couleur.

Modèle de zone désigne un modèle contenant des informations à propos de la taille et de l'emplacement des zones dans des documents similaires.

Mot composé désigne un terme composé d'au moins deux mots. Un mot composé désigne un mot que le programme ne parvient pas à trouver dans le dictionnaire mais qui peut être créé à partir d'au moins deux mots du dictionnaire.

Mots à faible fiabilité désigne des mots contenant au moins un caractère incertain.

O

OCR (reconnaissance optique de caractères - Optical Character Recognition) désigne une technologie permettant aux ordinateurs de lire le texte, de détecter des images, des tableaux et d'autres éléments de formatage.

Retour en haut de la page

P

Page de code désigne un tableau qui établit les correspondances entre les caractères et leurs codes. Les utilisateurs peuvent sélectionner les caractères dont ils ont besoin parmi les caractères disponibles dans une page de code.

Paradigme désigne l'ensemble de toutes les formes grammaticales d'un mot.

Pilote désigne un programme de logiciel qui contrôle un périphérique d'ordinateur (par exemple, un scanner, un moniteur, etc.).

Police à espacement fixe désigne une police (telle que Courier New) dont les caractères sont tous d'espacement égal. Pour de meilleurs résultats d'OCR des polices à espacement fixe, sur OCR l'onglet de la Options boîte de dialogue, sélectionnez Machine à écrire dans le Type de document groupe d'options.

R

Raccourcis clavier désigne des touches ou combinaisons de touches déclenchant une action spécifique lorsque vous appuyez dessus. L'utilisation de touches à accès rapide peut considérablement accroître votre productivité.

Résolution désigne un paramètre de numérisation dont l'unité de mesure est le point par pouce (ppp). Une résolution de 300 ppp doit être utilisée pour les textes avec une police de 10 pt minimum, 400 et 600 ppp étant préférable pour les textes dont la police est plus petite (9 pt maximum).

S

Séparateurs désigne les symboles permettant de séparer les mots (par exemple, /, \, tiret) et étant eux-mêmes séparés des mots par des espaces.

Système multi-polices désigne un système de reconnaissance capable de reconnaître les caractères définis dans toute police sans apprentissage préalable.

Retour en haut de la page

T

Type de document désigne un paramètre communiquant au programme comment le texte d'origine a été imprimé (par exemple, sur une imprimante laser, sur une machine à écrire, etc.). Pour les textes imprimés au laser, sélectionnez Auto, pour les textes dactylographiés, sélectionnez Machine à écrire, pour les faxes, sélectionnez Fax.

U

Unicode désigne une norme de codage de texte internationale et développée par le Consortium Unicode (Unicode, Inc.). La norme Unicode fournit un système 16 bits facilement extensible pour coder des symboles issus de presque toutes les langues contemporaines. Elle indique la manière dont les symboles doivent être codés et détermine les propriétés d'algorithmes et de caractères devant être utilisées pendant le processus de codage.

Z

Zone active désigne une zone actuellement sélectionnée sur l'image et pouvant être supprimée, déplacée ou modifiée. Pour activer une zone, cliquez dessus. Le cadre autour d'une zone active est en gras et est équipé de poignets de redimensionnement que vous pouvez faire glisser pour modifier la taille.

Zone code-barre désigne une image contenant un code-barre.

Zone de reconnaissance désigne une zone d'image que un poste de vérification est censé analyser automatiquement.

Zone de tableau désigne une zone de l'image contenant des données sous forme tabulaire. Lorsque le programme lit ce type de données, il trace des séparateurs verticaux et horizontaux à l'intérieur de la zone pour former un tableau. Cette zone a le rendu d'un tableau dans le texte de sortie.

Zone de texte désigne une zone de l'image contenant du texte. Les zones de texte ne doivent contenir qu'une seule colonne de texte.

Zone désigne la section d'une image inclue dans un cadre et contenant un certain type de données. Avant de procéder à la reconnaissance optique des caractères, un poste de vérification détecte les zones de texte, de tableau et de code barre afin de déterminer les sections de l'image qui devraient être reconnues et dans quel ordre.

Zone d'image d'arrière-plan désigne une image contenant une image avec un texte imprimé par-dessus.

Zone d'image désigne la zone contenant une image. Une zone de ce type peut contenir une image ou tout autre objet (par ex. : une partie de texte) à afficher sous forme d'image.

Retour en haut de la page

26.03.2024 13:49:51

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.