Glossaire

A

ABBYY FlexiCapture

Solution logicielle permettant l'entrée de données sous forme de flux unique à partir de différents types de documents structurés (formulaires fixes), semi-structurés (formulaires et documents flexibles) et non structurés (documents de format libre).

ABBYY FlexiLayout Studio

Programme vous permettant de créer un FlexiLayout de la structure d'un document, qui peut ensuite être utilisé pour la reconnaissance automatique du document.

ABBYY FormDesigner

ABBYY FormDesigner sert à concevoir des modèles de formulaires lisibles par machine. Une fois répliqués et remplis, ces formulaires peuvent être traités avec le système d'entrée de formulaires automatisé ABBYY FlexiCapture. La conception de la présentation du formulaire est une étape importante, car la qualité de la présentation conçue (sa lisibilité par la machine) détermine l'efficacité de toutes les étapes de traitement suivantes : numérisation, reconnaissance, vérification et exportation.

ABBYY FlexiCapture for Invoices

Un ABBYY FlexiCapture est une solution logicielle intelligente et simple d'utilisation pour traiter les factures.

ADF

Chargeur automatique de documents. Dispositif permettant de charger automatiquement les documents, ce qui permet de numériser un grand nombre de documents sans avoir à intervenir manuellement.

Administrateur

Utilisateur d'ABBYY FlexiCapture autorisé à configurer le programme pour l'entrée de documents : création et modification de définitions de document et de profils d'importation.

Alphabet

Ensemble de caractères utilisés dans la langue décrite.

Ancre

Élément statique sous forme de carré, de rectangle, de croix ou de coin noirs, servant pour l'association de la définition de document.

Détails...

Angle

Ancre en forme d'angle.

Annexe

Ensemble de pages qui ne contiennent pas de champs mais sont incluses dans l'assemblage du document. Aucune donnée n'est extraite de ces pages, mais ces pages peuvent être enregistrées sous forme d'images ou de fichiers PDF indexés.

Apprentissage [Document Definition]

Fonction de ABBYY FlexiCapture for Invoices qui permet aux utilisateurs de former le programme à la capture de données à partir de types spécifiques de factures. L'entraînement améliore la qualité de la capture de données et peut être réalisée lors de la configuration du programme ou pendant le traitement de factures.

Association de la définition de document

Opération consistant à sélectionner une définition de document et à associer ses champs à une image.

Auto-apprentissage

La capacité d'ABBYY FlexiCapture à apprendre automatiquement à détecter de nouveaux champs et à identifier les types de document.

B

Base de données externe

Un fichier texte ou une base de données compatible ODBC qui stocke les données de référence. Les données de référence peuvent inclure les valeurs possibles des champs capturés ou les informations requises pour capturer des champs.

C

Capacité de traitement

Nombre moyen de pages, de documents ou de lots traités au cours d’une période donnée.

Caractère ignoré

Caractère apparaissant au sein d'un mot (par exemple, une puce), ou caractère à tiret conditionnel (tabulation, etc.) dont la présence n'empêche pas le programme d'attribuer le mot à un type de données reconnaissable.

Détails...

Caractère interdit

Caractère dont vous savez avec certitude qu'il n'apparaîtra pas dans les données à reconnaître.

Détails...

Caractères reconnus incorrectement

Statut affecté automatiquement à un caractère qui, au cours du processus de reconnaissance, a été reconnu avec un degré d'incertitude considérable.

Carré noir

Ancre en forme de carré noir.

Catégorie de document

Ensemble de documents ou de pages partageant plusieurs caractéristiques communes.

Catégories de référence

Une catégorie de référence est une catégorie qui a été affectée à un document par un expert lors de la classification manuelle. Une section d'un document aussi bien qu'une version d'un document peuvent constituer une catégorie de référence.

Catégories de résultat

Une catégorie de résultat est une catégorie qui a été affectée à un document lors d'une classification automatique.

Champ

Élément de document destiné à l'extraction de données. Un champ peut être simple (sans structure interne) ou composite, comme un champ de tableau, où chaque cellule peut être affichée sous forme de champ subordonné du tableau.

Champ d'index

Champ dont la valeur est utilisée pour indexer les documents, afin de faciliter les opérations de tri et de recherche.

Champ de coche

Champ de définition de document contenant une coche.

Champ de code barre

Champ de définition de document contenant un code-barres destiné à la reconnaissance.

Champ de service

Un champ qui ne possède pas de région sur l'image du document. Les valeurs des champs de service sont déterminées automatiquement en fonction des données de la source indiquées dans leurs propriétés.

Champ clé

Champ qui permet de vérifier automatiquement l'assemblage des pages dans les documents. Les champs clés doivent avoir la même valeur sur toutes les pages d'un même document.

Champ contenant plusieurs instances

Champ utilisé pour décrire plusieurs objets du même type (objets récurrents). Par nature, ces objets multiples constituent un seul et même champ, et ils partagent les mêmes propriétés. Les champs contenant plusieurs instances servent à éviter de créer plusieurs champs identiques. Ils sont exportés dans des fichiers ou tables de base de données différents.

Champ contenant plusieurs régions

Champ composé de plusieurs régions de l'image. Ces régions peuvent être éloignées les unes des autres, et même être placées sur des pages différentes. Les valeurs de l'ensemble des régions appartenant au même champ sont combinées et exportées ensemble sous la forme d'un même champ. Ce type de champ est en principe utilisé pour des objets placés sur plusieurs pages, comme des tableaux particulièrement longs.

Champ d'entrée manuelle

Champ de définition de document contenant du texte non reconnaissable (par exemple, du texte composé de lettres qui se chevauchent) qui n'a pas été entré à l'aide d'un clavier.

Champ d'image

Champ de définition de document contenant une image.

Champ de texte

Élément de formulaire lisible par machine conçu pour entrer du texte lors du remplissage d'un formulaire.

Champ groupe de coches

Champ de définition de document contenant un groupe de coches.

Champ sans région

Champ détecté dans une définition de document mais qui ne comporte pas de région dans l'image.

Champ Tableau

Champ de définition de document contenant un tableau. C'est un champ composite, dans lequel chaque colonne de tableau représente un ensemble de champs du même type : texte, coches, codes-barres ou images.

Classificateur

Projet créé sous FlexiLayout Studio et destiné à une identification préliminaire des pages avant l'application des définitions de document ainsi qu'à la sélection d'un projet FlexiLayout ou de l'alternative de mise en page associé.

Coche

Élément de formulaire lisible par machine rempli d'une marque (biffure, croix, point, retouche, etc.) par la personne qui remplit le formulaire.

Coche corrigée

Coche qui a été sélectionnée par erreur, puis retouchée. Si l'option Autoriser les corrections est activée pour le champ de coches, le programme reconnaît la coche noircie comme non sélectionnée.

Code-barres

Formulaire lisible par machine, constitué d'une alternance de barres blanches et noires d'une certaine longueur, qui encodent des informations numériques. Dans un document, un code-barres peut servir à extraire des informations (champ de code-barres) ou à associer et à identifier une définition de document (code-barres d'ancrage).

Code barre d'ancrage

Élément statique représentant un code barre, et qui n'est pas destiné à l'extraction de données. Un code barre d'ancrage peut être utilisé pour l'association ou l'identification de Définition de document.

Contenu de trame mixte (MRC)

Méthode de compression utilisée pour les images contenant à la fois du texte et des fragments de trame. L'image est analysée par fragment et un algorithme de compression optimal est sélectionné pour chacun. Cette méthode permet d'obtenir de meilleurs taux de compression tout en préservant la qualité visuelle des images.

Contraste

Rapport mathématique entre les zones les plus claires et les plus sombres d'une image.

Control

Élément de texte, de champ ou de bouton du formulaire de données.

Croix

Ancre en forme de croix.

D

Définition de document

Une définition de document définit les principes d'identification et de traitement d'un type donné de documents et contient :

  • la structure du document, c’est-à-dire une description de l’ordre des pages autorisé pour les documents de ce type, qui définit le mode d’assemblage des documents
  • Définitions de sections de document
  • Liste des règles que les données de champ doivent satisfaire
  • L'emplacement des champs et leurs signatures dans la fenêtre de données (dans une vue de formulaire de données).
  • Paramètres d'exportation de document
  • Paramètres du traitement de document

Définition de document fixe

Définition de document, ou sa section, destinée au traitement de formulaires fixes. Les champs d'une définition de document fixe ont des emplacements fixes.

Définition de document flexible

Définition de document, ou sa section, destinée au traitement de documents semi-structurés. Créée à l'aide d'un FlexiLayout. Les champs d'une telle définition de document n'ont pas d'emplacement fixe. Ils sont détectés à l'aide d'un FlexiLayout.

Dictionnaire

Liste de mots utilisés pour déterminer un type de données spécifique.

Détails...

Dictionnaire utilisateur

Un dictionnaire auxiliaire créé par l'utilisateur qui contient des mots qui ne sont pas présents dans les dictionnaires intégrés. Les dictionnaires intégrés peuvent être complétés par un dictionnaire utilisateur pour améliorer la qualité de la capture de données. Généralement, un dictionnaire utilisateur contient des termes spécialisés, abréviations, noms de sociétés, etc.

Document

Combinaison d'une ou de plusieurs images de pages et de données extraites à partir de ces images.

Document de plusieurs pages

Document composé de plusieurs pages.

Document non structuré

Document contenant des informations présentées sous une forme libre. Il peut s'agir d'un contrat, d'une lettre, d'une commande ou d'un graphique, par exemple.

Documents semi-structurés.

Document contenant un ensemble de champs d'information dont la conception, le nombre et la présentation peuvent varier significativement dans différentes instances du document. Consultez Types de documents traités à l'aide d'ABBYY FlexiCapture.

Données de document

Données acquises après le traitement (reconnaissance, vérification et modification des résultats de reconnaissance) des images de pages de document.

Dossier d'images

Dossier du disque dur de l'ordinateur local ou d'un ordinateur distant qui sert à importer des images. Ce dossier est en principe utilisé pour télécharger périodiquement des images récurrentes sans que l'utilisateur intervienne.

E

Exemple de texte

Fichier contenant des exemples de tous les caractères alphabétiques.

Éléments statiques

Éléments non reconnaissables destinés à l'association et à l'identification de la définition de document. Les éléments de ce type sont : les ancres, le texte d'ancre, les séparateurs, les codes-barres d'ancrage.

Ensemble de documents

Ensemble de documents liés logiquement utilisés dans un but spécifique. Par exemple, un processus opérationnel peut être lancé à l'aide d'un ensemble de documents fournis par un demandeur. Cet ensemble se compose d'un formulaire de demande rempli et de certains documents complémentaires. En fonction des informations fournies par le demandeur dans le formulaire de demande, certains des documents complémentaires peuvent être facultatifs, alors que d’autres doivent obligatoirement être joints à la demande.

Entrée de documents sous forme de flux unique

Conversion automatique de documents papier sous une forme électronique.

Entrée de données sous forme de flux unique

Extraction automatique de données à partir de documents analogiques (imprimés) et numériques (images numérisées).

Erreur/Avertissement

L'erreur/l'avertissement se produit lorsque les données extraites d'un ou de plusieurs champs ne satisfont pas aux règles appliquées lors des vérifications automatiques ou ne concordent pas avec le format spécifié. Il convient de distinguer deux types d’erreurs et d’avertissements différents :

  • les erreurs/avertissements de champ unique sont générés par les règles et les formats qui affectent un champ ;
  • les erreurs/avertissements de champs multiples sont générés par les règles qui affectent plusieurs champs.

Erreur d'assemblage

Cette erreur se produit lorsqu'un document créé pendant l'assemblage de document contient des pages issues d'autres documents, lorsque ses propres pages sont dans le mauvais ordre ou lorsque les valeurs des champs clés des pages de document ne concordent pas.

Étape de traitement

Étape du flux de travail au cours de laquelle certaines actions sont exécutées sur un document ou un lot (que ce soit automatiquement ou par un opérateur).Consultez Étapes et files de traitement.

Exporter

Opération consistant à transférer les données traitées vers un système d'informations externe ou un fichier.

F

Facture

Un document répertoriant les marchandises fournies, leur quantité, prix, caractéristiques (comme la couleur, poids, etc.), conditions d'expédition et les détails des parties. Les factures peuvent être traitées par le biais d'une solution distincte, ABBYY FlexiCapture for Invoices.

Fichier de description

Fichier auxiliaire qui définit la méthode de constitution d'un lot lorsque des images sont ajoutées à partir d'un dossier actif.

File

Documents regroupés en tâches et/ou en lots qui attendent d'être traités à une certaine étape de traitement.Consultez Étapes et files de traitement.

FlexiLayout

Description de la structure d'un document semi-structuré. Cette description est conçue avec ABBYY FlexiLayout Studio et exportée vers ABBYY FlexiCapture. Format de fichier : *.afl. Un FlexiLayout est une sorte d'instruction permettant de détecter et d'identifier les champs.

Formulaire

Document comportant une ou plusieurs pages, conçu pour être rempli par une personne à la main ou à l'aide d'une technique d'impression.

Formulaire à arrière-plan couleur

Formulaire dans lequel tous les champs d'informations sont des rectangles blancs sur arrière-plan en couleur, qui disparaît pendant la numérisation.

Formulaire à fond gris

Formulaire dans lequel tous les champs d'informations sont des rectangles blancs sur fond gris, qui disparaît pendant la numérisation.

Formulaire à lignes noires et blanches

Formulaire dans lequel les bordures des champs d'informations sont formées par des lignes ordinaires qui ne disparaissent pas pendant la numérisation.

Formulaire fixe

Document avec des champs d'information fixes dont la mise en forme, le nombre et la présentation sont définis de manière stricte et ne changent pas d'une instance de document à l'autre.

Formulaire lisible par machine

Formulaire conçu spécialement pour l'entrée automatique. Il contient des éléments de travail (ancres, codes barres, lignes, etc.) nécessaires pour le traiter correctement.

Formulaire tramé

Formulaire dans lequel les champs d'informations sont représentés sous forme de rectangles blancs sur fond gris constitué de lignes de trame ou de rectangles délimités par des lignes de trame.

Fournisseur

Une personne légale ou physique qui vend des biens ou des services. Les fournisseurs émettent des factures pour leurs biens et services. Les données des factures peuvent être capturées par le biais de ABBYY FlexiCapture for Invoices.

Fournisseur d'identité

Un système tiers, tel que Azure AD, OneLogin ou Okta, qui gère les informations d'identité et fournit des services d'authentification à ses clients pour permettre aux utilisateurs finaux d'accéder à toutes les ressources autorisées de leur réseau local en entrant leurs informations d'identification une seule fois.

G

Groupe de coches

Élément de formulaire lisible par machine qui rassemble plusieurs coches situées à proximité les unes des autres. Une ou plusieurs coches peuvent être sélectionnées dans un groupe de coches.

I

Identificateur

Élément statique utilisé pour sélectionner une définition de document parmi plusieurs autres présentant des emplacements d'ancres identiques. L'option Utiliser pour l'identification de la définition de document doit être activée dans les propriétés des éléments statiques de ce type.

Identification de document

Processus d'attribution des documents à l'un des types de document prédéterminés.

Identification de la définition de document

Processus de sélection de la définition de document requise à l'aide d'identificateurs.

Image

Image électronique d'une page numérisée à partir d'un document papier.

Image

Élément de formulaire lisible par machine qui n'est pas destiné à la reconnaissance mais est prévu pour être exporté sous forme d'objet graphique (par exemple, un fichier).

Image inversée

Image contenant du texte légèrement coloré sur fond sombre.

Importation d'image

Processus d'ajout d'images à un lot avant le traitement L'importation peut être effectuée en ajoutant des images issues de fichiers, à l'aide d'un scanner ou des profils d'importation.

Imprimante matricielle

Type de texte reconnaissable qui représente un texte imprimé à l'aide d'une imprimante matricielle.

ICR, reconnaissance intelligente de caractères

Désigne les technologies ou systèmes conçus pour traiter en masse les documents remplis à l'aide de lettres et de chiffres manuscrits.

J

Jeu de caractères autorisés

Ensemble de caractères survenant dans le type de données reconnu.

Détails...

Jeu de données

Données utilisées pour les vérification de document automatisées. Un jeu de données peut être stocké sous forme de tableau dans ABBYY FlexiCapture et synchronisé selon un calendrier ou extrait d'une source externe.

K

L

Langue (locale)

Propriété de champ qui détermine la langue d'écriture et le jeu de paramètres régionaux approprié (comme le style d'écriture de la date ou de l'adresse).

Lettres encadrées

Type de marquage de texte selon lequel chaque caractère est délimité par un cadre. Les cadres ne sont pas séparés les uns des autres.

Afficher...

Lettres dans des cadres séparés

Type de marquage de texte selon lequel chaque caractère est délimité par un cadre. Les cadres sont séparés les uns des autres.

Afficher...

Lettres sur un peigne

Type de marquage de texte selon lequel le texte est délimité par un « peigne ».

Afficher...

Ligne tramée

Ligne composée de points espacés de manière égale.

Lots d'apprentissage

Lot de documents utilisé pour former et tester une définition de document pour une version de document spécifique. L'apprentissage d'une définition de document à partir d'un lot d'apprentissage permet la création d'une version de FlexiLayout. Consultez également Lot de documents, Version de document, Version de FlexiLayout.

Lot de documents

Combinaison de documents groupés par l'utilisateur. Un lot contient en principe la pile de documents numérisés au cours d'un même passage, ou importés à partir d'un dossier donné.

Lots de test

Lots de documents conçus pour tester et configurer des définitions de document. Les copies locales des lots de documents sont utilisées pour traiter les lots de test.

Lots de travail

Lots de documents destinés à l'entrée de données. Seules les définitions de document publiées sont utilisées pour traiter des lots de travail.

Luminosité

Seuil de sensibilité lumineuse qui détermine à partir de quel moment le scanner détecte les demi-tons en niveau de gris comme du blanc.

M

Machine à écrire

Type de texte reconnaissable qui représente un texte dactylographié à l'aide d'une machine à écrire.

Marquage de champ de texte

Élément graphique délimitant un champ de texte : cadre, peigne, ligne.

Marquage de texte

Structure d'une région de page destinée à recevoir du texte.

Mesure F du classificateur

Une mesure combinée de précision et de rappel pour la classification des documents. Elle est exprimée sous forme d'un nombre compris entre 0 et 1 ou d'un pourcentage compris entre 0 et 100 %.

Pour une catégorie, la mesure F est calculée comme suit : (β^2 + 1) * P * R / (β^2 * P + R), où P est la précision de la catégorie, R est le rappel de la catégorie et β est un paramètre libre qui détermine la pondération relative de la précision et du rappel pour le modèle donné. Valeur maximale = 1 (100 %) lorsque P = R = 1 (100 %).

Pour un lot de test ou d'apprentissage, la mesure F est calculée comme suit : (β^2 + 1) * P * R / (β^2 * P + R), où P est la précision du lot de test ou d'apprentissage, R est le rappel du lot de test ou d'apprentissage et β est un paramètre libre qui détermine la pondération relative de la précision et du rappel pour le modèle donné.

Multi-tenant

Fonctionnalité permettant à plusieurs utilisateurs indépendants d’utiliser ABBYY FlexiCapture. Les données de chaque tenant sont complètement isolées de celles des autres tenants. Le système attribue une partie de ses ressources à chaque tenant.

N

Nettoyage d'image

Suppression du bruit d'une image. Du bruit peut apparaître pendant la numérisation, et il est recommandé de le supprimer pour une meilleure reconnaissance des données. Pendant le nettoyage, le programme supprime également les points d'arrière-plan ou les lignes de contour des formes tramées.

Numérisation

Opération consistant à obtenir une image électronique d'un formulaire papier à l'aide d'un scanner.

O

OCR (reconnaissance optique de caractères)

Reconnaissance optique des textes imprimés.

OMR (reconnaissance optique de marques)

Cette technologie permet à ABBYY FlexiCapture de reconnaître à la fois les marques ordinaires (coches, croix, etc.) sur les formulaires avec un certain degré de précision, et de corriger les marques qui ont été faites par erreur et qui doivent être retouchées.

Opérateur

Utilisateur d’ABBYY FlexiCapture chargé de l'entrée de documents : ajout d'images, exécution de la reconnaissance et de la vérification, exportation des données reconnues.

Orientation de page

Emplacement de la page par rapport à l'alignement standard : de haut en bas, de gauche à droite. L'orientation d'une page peut être déterminée automatiquement pendant la reconnaissance de l'image de cette page. À cet effet, ABBYY FlexiCapture permet de spécifier plusieurs orientations.

Orientation du texte

Sens du texte d'un champ par rapport à la page.

P

Page

Image d'une page de document au format papier, et résultat de son traitement.

Page de code

Une table de valeurs qui décrit le jeu de caractères d'une langue en particulier.

ppp

Points par pouce. Nombre de points par pouce ; unité de résolution d'une image.

Précision

Une caractéristique qui permet à l'utilisateur d'évaluer la qualité de la classification automatique. Elle est calculée en divisant le nombre de documents correctement identifiés de catégorie A correctement identifiés par le nombre total de tous les documents identifiés comme appartenant à la catégorie A (de façon à la fois correcte et incorrecte).

Présentation

L'emplacement des champs dans l'image d'un document. Les présentations peuvent être générées automatiquement ou créées manuellement.

Présentation de page

Système montrant l'emplacement des champs d'une image.

Présentation de référence

Présentation créée par un utilisateur qui sert de référence pour les présentations créées automatiquement. Cette comparaison sert à évaluer dans quelle mesure le programme détecte les régions de champ.

Profil d'importation

Combinaison de paramètres utilisée pour ajouter des images à un lot : source d'importation, options de traitement des images, options de nettoyage du dossier actif, etc.

Profil d'exportation

Ensemble de paramètres qui déterminent ce qui est fait avec les données traitées : le format des fichiers de sortie, le chemin de sortie, les conditions d'exportation, etc.

Projet

Un projet est un environnement unique qui regroupe les lots de documents et les paramètres requis pour les traiter, comme les définitions de document, les profils d'importation, etc.

Publication de la définition de document

Opération consistant à accéder à une nouvelle version de définition de document une fois qu'elle a été modifiée. Une version publiée contribue au traitement des documents à partir de lots de travail, tandis qu'une version locale non publiée ne peut contribuer qu'au traitement de définitions de document à partir de lots de test.

R

Rappel

Une caractéristique qui permet à l'utilisateur d'évaluer la qualité de la classification automatique. Il est calculé en divisant le nombre de documents de catégorie A correctement identifiés par le nombre total de tous les documents de catégorie A.

Recherche dans la base de données

Comparer les données reconnues aux enregistrements de la base de données correspondants.

Reconnaissance

Processus consistant à associer des éléments d'image à des caractères spécifiques.

Reconnaissance

Langue sur laquelle se base ABBYY FlexiCapture lors de la reconnaissance.

Reconnaissance de code barre

Conversion d'une image de code barre graphique en valeurs numériques ou en texte.

Reconnaissance de texte (OCR, ICR)

Conversion d'une image graphique en texte.

Reconnaissance préliminaire

Reconnaissance de texte intégral des images de document pour faciliter la détection des champs par le biais d'une Définition de document.

Région de champ

Région d'image mise en surbrillance dans la définition de document et destinée à l'extraction de données.

Région non reconnaissable

Région d'image exclue de la reconnaissance. Une région non reconnaissable est requise pour exclure une région contenant du texte d'explication ou une image qui complique la reconnaissance d'un champ.

REN (Reconnaissance d'entités nommées)

Une tâche d'extraction d'informations basée sur la recherche d'attributs dans un texte non structuré et leur classement dans des catégories prédéfinies.

Règles

Conditions imposées aux données des champs. Ces conditions sont vérifiées automatiquement par le programme.

Résolution

Paramètre d'image. La résolution se mesure en points par pouce (ppp).

Rôle d'opérateur

Propriété d'un compte utilisateur dans ABBYY FlexiCapture qui détermine les données accessibles à l'utilisateur et les actions pouvant être exécutées sur ces données.

Rotation d'image

Rotation d'une image autour de son centre.

S

Section

Partie logiquement distincte d'un document contenant un ensemble de champs extractibles. Les sections sont utilisées à diverses fins au cours du processus de reconnaissance, telles que l’assemblage de documents à partir des pages. Les sections peuvent inclure une seule page ou plusieurs pages et peuvent être fixes ou flexibles.

Section de la définition de document

Composant d'une définition de document. Correspond à une ou à plusieurs pages contenant un ensemble de champs complet d'un point de vue logique. Au sein d'une même section, les champs peuvent s'étendre d'une page à la suivante (dans le cas de tableaux de plusieurs pages, par exemple), tandis que les ensembles de champs de différentes sections ne peuvent pas s'entrecouper.

Une définition de section peut être flexible ou fixe.

Section Sommaire

La section Sommaire est une section de définition de document qui affiche tous les champs principaux d'un ensemble de documents. Lorsqu'il s'agit d'analyser les documents d'un ensemble, la tâche des opérateurs en sera grandement facilitée, car ils pourront voir toutes les erreurs et les données peu fiables en un seul endroit et ouvrir uniquement les documents qui méritent une révision au lieu d'ouvrir chaque document.

Segment

Une zone d'un document constituée d'un ou plusieurs paragraphes. Utilisé pour réduire la zone de recherche des attributs. Peut également représenter un champ qui doit être extrait, par exemple : les conditions de résiliation d'un accord.

Segmentation

L'étape qui précède l'extraction des informations du texte. Permet de spécifier l'emplacement des données utiles dans un texte de taille importante (jusqu'au niveau du paragraphe). Par conséquent, la recherche n'est pas effectuée dans l'intégralité du document, mais seulement dans le segment lui-même, qui est une petite partie du document intégral.

Séparateur

Élément de formulaire lisible par machine représentant une ligne verticale ou horizontale.

SLA (accord de niveau de service)

Accord régissant la fourniture de services informatiques. Dans ABBYY FlexiCapture 12, un accord de niveau de service régit les délais de traitement des lots.

Style d'écriture

Manière d'écrire spécifique à un groupe donné. Par exemple, la manière des Américains d'écrire les nombres.

Détails...

Superposition

Processus consistant à combiner une numérisation d'un formulaire renseigné avec l'image d'un modèle vierge du même formulaire dans l'éditeur de définition de document.

T

Tableau

Ensemble de données organisé en grille bidimensionnelle qui n'est pas forcément visible. Le programme traite les tableaux composés de colonnes avec des données de même type et des lignes qui se répètent.

Tâche

Ensemble de documents issus du même lot à traiter en même temps. En fonction des paramètres du projet, et de l'étape de traitement, une tâche peut contenir des numéros de documents différents. Si une étape de traitement requiert le traitement d'un lot dans son intégralité, tout le lot est inclus dans la tâche. Lorsque les tâches de vérification sont formées automatiquement, chaque tâche contient 10 documents (si un lot contient moins de 10 documents non vérifiés, ils seront tous traités en une seule tâche).

Tenant

Une instance isolée d'ABBYY FlexiCapture pouvant être utilisée indépendamment des autres utilisateurs.

Texte à espacement fixe

Type de marquage de texte selon lequel chaque lettre est placée dans un cadre de la même hauteur et de la même largeur, mais dont les bords disparaissent pendant la numérisation.

Texte d'ancre

Élément statique représentant un texte présent sur un formulaire vide, et qui n'est pas destiné à l'extraction de données. Il peut s'agir de texte explicatif ou d'un en-tête. Un texte d'ancre peut être utilisé pour l'association ou l'identification de la Définition de document.

Texte d'explication

Élément de formulaire lisible par machine qui représente un texte descriptif (nom de formulaire, noms de champs, explications de champs, etc.).

Texte dactylographié

Type de texte reconnaissable qui a été imprimé à l'aide d'un équipement typographique ou d'une imprimante laser ou à jet d'encre présentant une résolution minimale de 300 ppp.

Texte du document

Tout le texte du document qui a été capturé à partir du document pendant la reconnaissance préliminaire, avant que le FlexiLayout ne soit appliqué. Vous pouvez choisir d'enregistrer ce texte (nécessite de l'espace supplémentaire sur le disque dur) afin qu'il puisse être utilisé pendant la vérification.

Texte encadré

Type de marquage de texte selon lequel le texte est délimité par un cadre.

Afficher...

Texte encadré par-dessus un peigne

Type de marquage de texte selon lequel le texte est délimité par un cadre dont la limite inférieure est en forme de peigne.

Afficher...

Texte manuscrit en lettres d'imprimerie

Type de texte reconnaissable avec des lettres distinctes.

Texte manuscrit

Un type de texte reconnaissable avec des lettres jointes ou partiellement jointes.
Remarque : Actuellement, seul du texte écrit à la main en anglais peut être reconnu.

Texte simple

Type de marquage de texte selon lequel le texte est inséré dans un bloc sans délimiteurs.

Texte souligné

Type de marquage de texte selon lequel le texte est souligné.

Afficher...

TLN (Traitement de la langue naturelle)

Un sous-domaine de l'intelligence artificielle et de la linguistique mathématique. Concerne l'analyse informatique et la synthèse des langues naturelles. Une application possible est l'extraction d'informations utiles d'un texte. Comprend ce qui suit : traduction automatique, robots de chat, classification, analyse de tonalité, extraction de données, etc.

Type de document

Un certain nombre de documents présentant plusieurs caractéristiques communes et jouant un rôle spécifique dans les processus opérationnels.

Notons les factures, les contrats et les passeports parmi les exemples de types de documents.

Type de données

Attribut de champ décrivant les contraintes connues des valeurs de champs possibles. Il est utilisé pendant la reconnaissance des champs pour réduire le nombre de variantes de reconnaissance possibles.

Détails...

Type de données personnalisé

Type de données défini par l'utilisateur.

Type de lot

Propriété d'un lot qui définit de quelle manière doivent être traités les documents dans les lots correspondant.

V

Validation par règle

Contrôle automatique des données reconnues par rapport à un ensemble de règles prédéfinies. Consultez Validation par règle.

Variable d'environnement

Une chaîne utilisée pour stocker du texte, ex. : paramètres système. Les variables d'environnement peuvent être utilisées pour stocker des chaînes et variables de connexion de base de données utilisées lors de la définition des noms des fichiers exportés.

Vérification

La vérification consiste à s'assurer que les données ont été reconnues, que les pages ont été assemblées en documents correctement et que les règles n'ont pas généré d'erreurs. La vérification est effectuée sur le poste de vérification des données (où la précision de la reconnaissance est vérifiée) et sur le poste de vérification (où tous les types de vérification peuvent être effectués).

Vérification de champs

Mode de vérification au cours duquel les caractères reconnus sont soumis à une vérification dans le contexte d'un champ.

Détails...

Version de document

Documents appartenant au même type et partageant plusieurs caractéristiques.

Notons les factures de différents fournisseurs et les relevés de carte de crédit d'une même banque parmi les exemples de versions de document.

Version de FlexiLayout

FlexiLayout pour une version de document développé spécifiquement pour cette version de document ou formé à cette version de document. Utilisé en association avec un FlexiLayout générique.

Vérification groupée

Mode de vérification suivant lequel les caractères reconnus de manière identique sont soumis à la vérification en groupes.

Détails...

X

XFD

Définition de formulaire XML (*.xfd), un format de fichier spécifique conçu avec ABBYY FormDesigner. Un fichier au format XFD (XML Form Definition) est utilisé pour créer des définitions de document dans ABBYY FlexiCapture.

12.04.2024 18:16:03

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.