Glossaire
A
ABBYY FlexiCapture
Solution logicielle permettant l'entrée de données sous forme de flux unique à partir de différents types de documents structurés (formulaires fixes), semi-structurés (formulaires et documents flexibles) et non structurés (documents de format libre).
ABBYY FlexiLayout Studio
Programme vous permettant de créer un FlexiLayout de la structure d'un document, qui peut ensuite être utilisé pour la reconnaissance automatique du document.
ABBYY FormDesigner
ABBYY FormDesigner sert à concevoir des modèles de formulaires lisibles par machine. Une fois répliqués et remplis, ces formulaires peuvent être traités avec le système d'entrée de formulaires automatisé ABBYY FlexiCapture. La conception de la présentation du formulaire est une étape importante, car la qualité de la présentation conçue (sa lisibilité par la machine) détermine l'efficacité de toutes les étapes de traitement suivantes : numérisation, reconnaissance, vérification et exportation.
ABBYY FlexiCapture for Invoices
Un ABBYY FlexiCapture est une solution logicielle intelligente et simple d'utilisation pour traiter les factures.
ADF
Chargeur automatique de documents. Dispositif permettant de charger automatiquement les documents, ce qui permet de numériser un grand nombre de documents sans avoir à intervenir manuellement.
Administrateur
Utilisateur d'ABBYY FlexiCapture autorisé à configurer le programme pour l'entrée de documents : création et modification de définitions de document et de profils d'importation.
Alphabet
Ensemble de caractères utilisés dans la langue décrite.
Ancre
Élément statique sous forme de carré, de rectangle, de croix ou de coin noirs, servant pour l'association de la définition de document.
Détails...
Angle
Ancre en forme d'angle.
Annexe
Ensemble de pages qui ne contiennent pas de champs mais sont incluses dans l'assemblage du document. Aucune donnée n'est extraite de ces pages, mais ces pages peuvent être enregistrées sous forme d'images ou de fichiers PDF indexés.
Apprentissage [Document Definition]
Fonction de ABBYY FlexiCapture for Invoices qui permet aux utilisateurs de former le programme à la capture de données à partir de types spécifiques de factures. L'entraînement améliore la qualité de la capture de données et peut être réalisée lors de la configuration du programme ou pendant le traitement de factures.
Association de la définition de document
Opération consistant à sélectionner une définition de document et à associer ses champs à une image.
Auto-apprentissage
La capacité d'ABBYY FlexiCapture à apprendre automatiquement à détecter de nouveaux champs et à identifier les types de document.
B
Base de données externe
Un fichier texte ou une base de données compatible ODBC qui stocke les données de référence. Les données de référence peuvent inclure les valeurs possibles des champs capturés ou les informations requises pour capturer des champs.
C
Capacité de traitement
Nombre moyen de pages, de documents ou de lots traités au cours d’une période donnée.
Caractère ignoré
Caractère apparaissant au sein d'un mot (par exemple, une puce), ou caractère à tiret conditionnel (tabulation, etc.) dont la présence n'empêche pas le programme d'attribuer le mot à un type de données reconnaissable.
Détails...
Caractère interdit
Caractère dont vous savez avec certitude qu'il n'apparaîtra pas dans les données à reconnaître.
Détails...
Caractères reconnus incorrectement
Statut affecté automatiquement à un caractère qui, au cours du processus de reconnaissance, a été reconnu avec un degré d'incertitude considérable.
Carré noir
Ancre en forme de carré noir.
Catégorie de document
Ensemble de documents ou de pages partageant plusieurs caractéristiques communes.
Catégories de référence
Une catégorie de référence est une catégorie qui a été affectée à un document par un expert lors de la classification manuelle. Une section d'un document aussi bien qu'une version d'un document peuvent constituer une catégorie de référence.
Catégories de résultat
Une catégorie de résultat est une catégorie qui a été affectée à un document lors d'une classification automatique.
Champ
Élément de document destiné à l'extraction de données. Un champ peut être simple (sans structure interne) ou composite, comme un champ de tableau, où chaque cellule peut être affichée sous forme de champ subordonné du tableau.
Champ d'index
Champ dont la valeur est utilisée pour indexer les documents, afin de faciliter les opérations de tri et de recherche.
Champ de coche
Champ de définition de document contenant une coche.
Champ de code barre
Champ de définition de document contenant un code-barres destiné à la reconnaissance.
Champ de service
Un champ qui ne possède pas de région sur l'image du document. Les valeurs des champs de service sont déterminées automatiquement en fonction des données de la source indiquées dans leurs propriétés.
Champ clé
Champ qui permet de vérifier automatiquement l'assemblage des pages dans les documents. Les champs clés doivent avoir la même valeur sur toutes les pages d'un même document.
Champ contenant plusieurs instances
Champ utilisé pour décrire plusieurs objets du même type (objets récurrents). Par nature, ces objets multiples constituent un seul et même champ, et ils partagent les mêmes propriétés. Les champs contenant plusieurs instances servent à éviter de créer plusieurs champs identiques. Ils sont exportés dans des fichiers ou tables de base de données différents.
Champ contenant plusieurs régions
Champ composé de plusieurs régions de l'image. Ces régions peuvent être éloignées les unes des autres, et même être placées sur des pages différentes. Les valeurs de l'ensemble des régions appartenant au même champ sont combinées et exportées ensemble sous la forme d'un même champ. Ce type de champ est en principe utilisé pour des objets placés sur plusieurs pages, comme des tableaux particulièrement longs.
Champ d'entrée manuelle
Champ de définition de document contenant du texte non reconnaissable (par exemple, du texte composé de lettres qui se chevauchent) qui n'a pas été entré à l'aide d'un clavier.
Champ d'image
Champ de définition de document contenant une image.
Champ de texte
Élément de formulaire lisible par machine conçu pour entrer du texte lors du remplissage d'un formulaire.
Champ groupe de coches
Champ de définition de document contenant un groupe de coches.
Champ sans région
Champ détecté dans une définition de document mais qui ne comporte pas de région dans l'image.
Champ Tableau
Champ de définition de document contenant un tableau. C'est un champ composite, dans lequel chaque colonne de tableau représente un ensemble de champs du même type : texte, coches, codes-barres ou images.
Classificateur
Projet créé sous FlexiLayout Studio et destiné à une identification préliminaire des pages avant l'application des définitions de document ainsi qu'à la sélection d'un projet FlexiLayout ou de l'alternative de mise en page associé.
Coche
Élément de formulaire lisible par machine rempli d'une marque (biffure, croix, point, retouche, etc.) par la personne qui remplit le formulaire.
Coche corrigée
Coche qui a été sélectionnée par erreur, puis retouchée. Si l'option Autoriser les corrections est activée pour le champ de coches, le programme reconnaît la coche noircie comme non sélectionnée.
Code-barres
Formulaire lisible par machine, constitué d'une alternance de barres blanches et noires d'une certaine longueur, qui encodent des informations numériques. Dans un document, un code-barres peut servir à extraire des informations (champ de code-barres) ou à associer et à identifier une définition de document (code-barres d'ancrage).
Code barre d'ancrage
Élément statique représentant un code barre, et qui n'est pas destiné à l'extraction de données. Un code barre d'ancrage peut être utilisé pour l'association ou l'identification de Définition de document.
Contenu de trame mixte (MRC)
Méthode de compression utilisée pour les images contenant à la fois du texte et des fragments de trame. L'image est analysée par fragment et un algorithme de compression optimal est sélectionné pour chacun. Cette méthode permet d'obtenir de meilleurs taux de compression tout en préservant la qualité visuelle des images.
Contraste
Rapport mathématique entre les zones les plus claires et les plus sombres d'une image.
Control
Élément de texte, de champ ou de bouton du formulaire de données.
Croix
Ancre en forme de croix.
D
Définition de document
Une définition de document définit les principes d'identification et de traitement d'un type donné de documents et contient :
- la structure du document, c’est-à-dire une description de l’ordre des pages autorisé pour les documents de ce type, qui définit le mode d’assemblage des documents
- Définitions de sections de document
- Liste des règles que les données de champ doivent satisfaire
- L'emplacement des champs et leurs signatures dans la fenêtre de données (dans une vue de formulaire de données).
- Paramètres d'exportation de document
- Paramètres du traitement de document
Définition de document fixe
Définition de document, ou sa section, destinée au traitement de formulaires fixes. Les champs d'une définition de document fixe ont des emplacements fixes.
Définition de document flexible
Définition de document, ou sa section, destinée au traitement de documents semi-structurés. Créée à l'aide d'un FlexiLayout. Les champs d'une telle définition de document n'ont pas d'emplacement fixe. Ils sont détectés à l'aide d'un FlexiLayout.
Dictionnaire
Liste de mots utilisés pour déterminer un type de données spécifique.
Détails...
Dictionnaire utilisateur
Un dictionnaire auxiliaire créé par l'utilisateur qui contient des mots qui ne sont pas présents dans les dictionnaires intégrés. Les dictionnaires intégrés peuvent être complétés par un dictionnaire utilisateur pour améliorer la qualité de la capture de données. Généralement, un dictionnaire utilisateur contient des termes spécialisés, abréviations, noms de sociétés, etc.
Document
Combinaison d'une ou de plusieurs images de pages et de données extraites à partir de ces images.
Document de plusieurs pages
Document composé de plusieurs pages.
Document non structuré
Document contenant des informations présentées sous une forme libre. Il peut s'agir d'un contrat, d'une lettre, d'une commande ou d'un graphique, par exemple.
Documents semi-structurés.
Document contenant un ensemble de champs d'information dont la conception, le nombre et la présentation peuvent varier significativement dans différentes instances du document. Consultez Types de documents traités à l'aide d'ABBYY FlexiCapture.
Données de document
Données acquises après le traitement (reconnaissance, vérification et modification des résultats de reconnaissance) des images de pages de document.
Dossier d'images
Dossier du disque dur de l'ordinateur local ou d'un ordinateur distant qui sert à importer des images. Ce dossier est en principe utilisé pour télécharger périodiquement des images récurrentes sans que l'utilisateur intervienne.
E
Exemple de texte
Fichier contenant des exemples de tous les caractères alphabétiques.
Éléments statiques
Éléments non reconnaissables destinés à l'association et à l'identification de la définition de document. Les éléments de ce type sont : les ancres, le texte d'ancre, les séparateurs, les codes-barres d'ancrage.
Ensemble de documents
Ensemble de documents liés logiquement utilisés dans un but spécifique. Par exemple, un processus opérationnel peut être lancé à l'aide d'un ensemble de documents fournis par un demandeur. Cet ensemble se compose d'un formulaire de demande rempli et de certains documents complémentaires. En fonction des informations fournies par le demandeur dans le formulaire de demande, certains des documents complémentaires peuvent être facultatifs, alors que d’autres doivent obligatoirement être joints à la demande.
Entrée de documents sous forme de flux unique
Conversion automatique de documents papier sous une forme électronique.
Entrée de données sous forme de flux unique
Extraction automatique de données à partir de documents analogiques (imprimés) et numériques (images numérisées).
Erreur/Avertissement
L'erreur/l'avertissement se produit lorsque les données extraites d'un ou de plusieurs champs ne satisfont pas aux règles appliquées lors des vérifications automatiques ou ne concordent pas avec le format spécifié. Il convient de distinguer deux types d’erreurs et d’avertissements différents :
- les erreurs/avertissements de champ unique sont générés par les règles et les formats qui affectent un champ ;
- les erreurs/avertissements de champs multiples sont générés par les règles qui affectent plusieurs champs.
Erreur d'assemblage
Cette erreur se produit lorsqu'un document créé pendant l'assemblage de document contient des pages issues d'autres documents, lorsque ses propres pages sont dans le mauvais ordre ou lorsque les valeurs des champs clés des pages de document ne concordent pas.
Étape de traitement
Étape du flux de travail au cours de laquelle certaines actions sont exécutées sur un document ou un lot (que ce soit automatiquement ou par un opérateur).Consultez Étapes et files de traitement.
Exporter
Opération consistant à transférer les données traitées vers un système d'informations externe ou un fichier.
F
Facture
Un document répertoriant les marchandises fournies, leur quantité, prix, caractéristiques (comme la couleur, poids, etc.), conditions d'expédition et les détails des parties. Les factures peuvent être traitées par le biais d'une solution distincte, ABBYY FlexiCapture for Invoices.
Fichier de description
Fichier auxiliaire qui définit la méthode de constitution d'un lot lorsque des images sont ajoutées à partir d'un dossier actif.
File
Documents regroupés en tâches et/ou en lots qui attendent d'être traités à une certaine étape de traitement.Consultez Étapes et files de traitement.
FlexiLayout
Description de la structure d'un document semi-structuré. Cette description est conçue avec ABBYY FlexiLayout Studio et exportée vers ABBYY FlexiCapture. Format de fichier : *.afl. Un FlexiLayout est une sorte d'instruction permettant de détecter et d'identifier les champs.
Formulaire
Document comportant une ou plusieurs pages, conçu pour être rempli par une personne à la main ou à l'aide d'une technique d'impression.
Formulaire à arrière-plan couleur
Formulaire dans lequel tous les champs d'informations sont des rectangles blancs sur arrière-plan en couleur, qui disparaît pendant la numérisation.
Formulaire à fond gris
Formulaire dans lequel tous les champs d'informations sont des rectangles blancs sur fond gris, qui disparaît pendant la numérisation.
Formulaire à lignes noires et blanches
Formulaire dans lequel les bordures des champs d'informations sont formées par des lignes ordinaires qui ne disparaissent pas pendant la numérisation.
Formulaire fixe
Document avec des champs d'information fixes dont la mise en forme, le nombre et la présentation sont définis de manière stricte et ne changent pas d'une instance de document à l'autre.
Formulaire lisible par machine
Formulaire conçu spécialement pour l'entrée automatique. Il contient des éléments de travail (ancres, codes barres, lignes, etc.) nécessaires pour le traiter correctement.
Formulaire tramé
Formulaire dans lequel les champs d'informations sont représentés sous forme de rectangles blancs sur fond gris constitué de lignes de trame ou de rectangles délimités par des lignes de trame.
Fournisseur
Une personne légale ou physique qui vend des biens ou des services. Les fournisseurs émettent des factures pour leurs biens et services. Les données des factures peuvent être capturées par le biais de ABBYY FlexiCapture for Invoices.
Fournisseur d'identité
Un système tiers, tel que Azure AD, OneLogin ou Okta, qui gère les informations d'identité et fournit des services d'authentification à ses clients pour permettre aux utilisateurs finaux d'accéder à toutes les ressources autorisées de leur réseau local en entrant leurs informations d'identification une seule fois.
G
Groupe de coches
Élément de formulaire lisible par machine qui rassemble plusieurs coches situées à proximité les unes des autres. Une ou plusieurs coches peuvent être sélectionnées dans un groupe de coches.
I
Identificateur
Élément statique utilisé pour sélectionner une définition de document parmi plusieurs autres présentant des emplacements d'ancres identiques. L'option Utiliser pour l'identification de la définition de document doit être activée dans les propriétés des éléments statiques de ce type.
Identification de document
Processus d'attribution des documents à l'un des types de document prédéterminés.
Identification de la définition de document
Processus de sélection de la définition de document requise à l'aide d'identificateurs.
Image
Image électronique d'une page numérisée à partir d'un document papier.
Image
Élément de formulaire lisible par machine qui n'est pas destiné à la reconnaissance mais est prévu pour être exporté sous forme d'objet graphique (par exemple, un fichier).
Image inversée
Image contenant du texte légèrement coloré sur fond sombre.
Importation d'image
Processus d'ajout d'images à un lot avant le traitement L'importation peut être effectuée en ajoutant des images issues de fichiers, à l'aide d'un scanner ou des profils d'importation.
Imprimante matricielle
Type de texte reconnaissable qui représente un texte imprimé à l'aide d'une imprimante matricielle.
ICR, reconnaissance intelligente de caractères
Désigne les technologies ou systèmes conçus pour traiter en masse les documents remplis à l'aide de lettres et de chiffres manuscrits.
J
Jeu de caractères autorisés
Ensemble de caractères survenant dans le type de données reconnu.
Détails...
Jeu de données
Données utilisées pour les vérification de document automatisées. Un jeu de données peut être stocké sous forme de tableau dans ABBYY FlexiCapture et synchronisé selon un calendrier ou extrait d'une source externe.
K
L
Langue (locale)
Propriété de champ qui détermine la langue d'écriture et le jeu de paramètres régionaux approprié (comme le style d'écriture de la date ou de l'adresse).
Lettres encadrées
Type de marquage de texte selon lequel chaque caractère est délimité par un cadre. Les cadres ne sont pas séparés les uns des autres.
Afficher...
Lettres dans des cadres séparés
Type de marquage de texte selon lequel chaque caractère est délimité par un cadre. Les cadres sont séparés les uns des autres.
Afficher...
Lettres sur un peigne
Type de marquage de texte selon lequel le texte est délimité par un « peigne ».
Afficher...
Ligne tramée
Ligne composée de points espacés de manière égale.
Lots d'apprentissage
Lot de documents utilisé pour former et tester une définition de document pour une version de document spécifique. L'apprentissage d'une définition de document à partir d'un lot d'apprentissage permet la création d'une version de FlexiLayout. Consultez également Lot de documents, Version de document, Version de FlexiLayout.
Lot de documents
Combinaison de documents groupés par l'utilisateur. Un lot contient en principe la pile de documents numérisés au cours d'un même passage, ou importés à partir d'un dossier donné.
Lots de test
Lots de documents conçus pour tester et configurer des définitions de document. Les copies locales des lots de documents sont utilisées pour traiter les lots de test.
Lots de travail
Lots de documents destinés à l'entrée de données. Seules les définitions de document publiées sont utilisées pour traiter des lots de travail.
Luminosité
Seuil de sensibilité lumineuse qui détermine à partir de quel moment le scanner détecte les demi-tons en niveau de gris comme du blanc.
M
Machine à écrire
Type de texte reconnaissable qui représente un texte dactylographié à l'aide d'une machine à écrire.
Marquage de champ de texte
Élément graphique délimitant un champ de texte : cadre, peigne, ligne.
Marquage de texte
Structure d'une région de page destinée à recevoir du texte.
Mesure F du classificateur
Une mesure combinée de précision et de rappel pour la classification des documents. Elle est exprimée sous forme d'un nombre compris entre 0 et 1 ou d'un pourcentage compris entre 0 et 100 %.
Pour une catégorie, la mesure F est calculée comme suit : (β^2 + 1) * P * R / (β^2 * P + R), où P est la précision de la catégorie, R est le rappel de la catégorie et β est un paramètre libre qui détermine la pondération relative de la précision et du rappel pour le modèle donné. Valeur maximale = 1 (100 %) lorsque P = R = 1 (100 %).
Pour un lot de test ou d'apprentissage, la mesure F est calculée comme suit : (β^2 + 1) * P * R / (β^2 * P + R), où P est la précision du lot de test ou d'apprentissage, R est le rappel du lot de test ou d'apprentissage et β est un paramètre libre qui détermine la pondération relative de la précision et du rappel pour le modèle donné.
Multi-tenant
Fonctionnalité permettant à plusieurs utilisateurs indépendants d’utiliser ABBYY FlexiCapture. Les données de chaque tenant sont complètement isolées de celles des autres tenants. Le système attribue une partie de ses ressources à chaque tenant.
N
Nettoyage d'image
Suppression du bruit d'une image. Du bruit peut apparaître pendant la numérisation, et il est recommandé de le supprimer pour une meilleure reconnaissance des données. Pendant le nettoyage, le programme supprime également les points d'arrière-plan ou les lignes de contour des formes tramées.
Numérisation
Opération consistant à obtenir une image électronique d'un formulaire papier à l'aide d'un scanner.
O
OCR (reconnaissance optique de caractères)
Reconnaissance optique des textes imprimés.
OMR (reconnaissance optique de marques)
Cette technologie permet à ABBYY FlexiCapture de reconnaître à la fois les marques ordinaires (coches, croix, etc.) sur les formulaires avec un certain degré de précision, et de corriger les marques qui ont été faites par erreur et qui doivent être retouchées.
Opérateur
Utilisateur d’ABBYY FlexiCapture chargé de l'entrée de documents : ajout d'images, exécution de la reconnaissance et de la vérification, exportation des données reconnues.
Orientation de page
Emplacement de la page par rapport à l'alignement standard : de haut en bas, de gauche à droite. L'orientation d'une page peut être déterminée automatiquement pendant la reconnaissance de l'image de cette page. À cet effet, ABBYY FlexiCapture permet de spécifier plusieurs orientations.
Orientation du texte
Sens du texte d'un champ par rapport à la page.
P
Page
Image d'une page de document au format papier, et résultat de son traitement.
Page de code
Une table de valeurs qui décrit le jeu de caractères d'une langue en particulier.
ppp
Points par pouce. Nombre de points par pouce ; unité de résolution d'une image.
Précision
Une caractéristique qui permet à l'utilisateur d'évaluer la qualité de la classification automatique. Elle est calculée en divisant le nombre de documents correctement identifiés de catégorie A correctement identifiés par le nombre total de tous les documents identifiés comme appartenant à la catégorie A (de façon à la fois correcte et incorrecte).
Présentation
L'emplacement des champs dans l'image d'un document. Les présentations peuvent être générées automatiquement ou créées manuellement.
Présentation de page
Système montrant l'emplacement des champs d'une image.
Présentation de référence
Présentation créée par un utilisateur qui sert de référence pour les présentations créées automatiquement. Cette comparaison sert à évaluer dans quelle mesure le programme détecte les régions de champ.
Profil d'importation
Combinaison de paramètres utilisée pour ajouter des images à un lot : source d'importation, options de traitement des images, options de nettoyage du dossier actif, etc.
Profil d'exportation
Ensemble de paramètres qui déterminent ce qui est fait avec les données traitées : le format des fichiers de sortie, le chemin de sortie, les conditions d'exportation, etc.
Projet
Un projet est un environnement unique qui regroupe les lots de documents et les paramètres requis pour les traiter, comme les définitions de document, les profils d'importation, etc.
Publication de la définition de document
Opération consistant à accéder à une nouvelle version de définition de document une fois qu'elle a été modifiée. Une version publiée contribue au traitement des documents à partir de lots de travail, tandis qu'une version locale non publiée ne peut contribuer qu'au traitement de définitions de document à partir de lots de test.
R
Rappel
Une caractéristique qui permet à l'utilisateur d'évaluer la qualité de la classification automatique. Il est calculé en divisant le nombre de documents de catégorie A correctement identifiés par le nombre total de tous les documents de catégorie A.
Recherche dans la base de données
Comparer les données reconnues aux enregistrements de la base de données correspondants.
Reconnaissance
Processus consistant à associer des éléments d'image à des caractères spécifiques.
Reconnaissance
Langue sur laquelle se base ABBYY FlexiCapture lors de la reconnaissance.
Reconnaissance de code barre
Conversion d'une image de code barre graphique en valeurs numériques ou en texte.
Reconnaissance de texte (OCR, ICR)
Conversion d'une image graphique en texte.
Reconnaissance préliminaire
Reconnaissance de texte intégral des images de document pour faciliter la détection des champs par le biais d'une Définition de document.
Région de champ
Région d'image mise en surbrillance dans la définition de document et destinée à l'extraction de données.
Région non reconnaissable
Région d'image exclue de la reconnaissance. Une région non reconnaissable est requise pour exclure une région contenant du texte d'explication ou une image qui complique la reconnaissance d'un champ.
REN (Reconnaissance d'entités nommées)
Une tâche d'extraction d'informations basée sur la recherche d'attributs dans un texte non structuré et leur classement dans des catégories prédéfinies.
Règles
Conditions imposées aux données des champs. Ces conditions sont vérifiées automatiquement par le programme.
Résolution
Paramètre d'image. La résolution se mesure en points par pouce (ppp).
Rôle d'opérateur
Propriété d'un compte utilisateur dans ABBYY FlexiCapture qui détermine les données accessibles à l'utilisateur et les actions pouvant être exécutées sur ces données.
Rotation d'image
Rotation d'une image autour de son centre.
S
Section
Partie logiquement distincte d'un document contenant un ensemble de champs extractibles. Les sections sont utilisées à diverses fins au cours du processus de reconnaissance, telles que l’assemblage de documents à partir des pages. Les sections peuvent inclure une seule page ou plusieurs pages et peuvent être fixes ou flexibles.
Section de la définition de document
Composant d'une définition de document. Correspond à une ou à plusieurs pages contenant un ensemble de champs complet d'un point de vue logique. Au sein d'une même section, les champs peuvent s'étendre d'une page à la suivante (dans le cas de tableaux de plusieurs pages, par exemple), tandis que les ensembles de champs de différentes sections ne peuvent pas s'entrecouper.
Une définition de section peut être flexible ou fixe.
Section Sommaire
La section Sommaire est une section de définition de document qui affiche tous les champs principaux d'un ensemble de documents. Lorsqu'il s'agit d'analyser les documents d'un ensemble, la tâche des opérateurs en sera grandement facilitée, car ils pourront voir toutes les erreurs et les données peu fiables en un seul endroit et ouvrir uniquement les documents qui méritent une révision au lieu d'ouvrir chaque document.
Segment
Une zone d'un document constituée d'un ou plusieurs paragraphes. Utilisé pour réduire la zone de recherche des attributs. Peut également représenter un champ qui doit être extrait, par exemple : les conditions de résiliation d'un accord.
Segmentation
L'étape qui précède l'extraction des informations du texte. Permet de spécifier l'emplacement des données utiles dans un texte de taille importante (jusqu'au niveau du paragraphe). Par conséquent, la recherche n'est pas effectuée dans l'intégralité du document, mais seulement dans le segment lui-même, qui est une petite partie du document intégral.
Séparateur
Élément de formulaire lisible par machine représentant une ligne verticale ou horizontale.
SLA (accord de niveau de service)
Accord régissant la fourniture de services informatiques. Dans ABBYY FlexiCapture 12, un accord de niveau de service régit les délais de traitement des lots.
Style d'écriture
Manière d'écrire spécifique à un groupe donné. Par exemple, la manière des Américains d'écrire les nombres.
Détails...
Superposition
Processus consistant à combiner une numérisation d'un formulaire renseigné avec l'image d'un modèle vierge du même formulaire dans l'éditeur de définition de document.
T
Tableau
Ensemble de données organisé en grille bidimensionnelle qui n'est pas forcément visible. Le programme traite les tableaux composés de colonnes avec des données de même type et des lignes qui se répètent.
Tâche
Ensemble de documents issus du même lot à traiter en même temps. En fonction des paramètres du projet, et de l'étape de traitement, une tâche peut contenir des numéros de documents différents. Si une étape de traitement requiert le traitement d'un lot dans son intégralité, tout le lot est inclus dans la tâche. Lorsque les tâches de vérification sont formées automatiquement, chaque tâche contient 10 documents (si un lot contient moins de 10 documents non vérifiés, ils seront tous traités en une seule tâche).
Tenant
Une instance isolée d'ABBYY FlexiCapture pouvant être utilisée indépendamment des autres utilisateurs.
Texte à espacement fixe
Type de marquage de texte selon lequel chaque lettre est placée dans un cadre de la même hauteur et de la même largeur, mais dont les bords disparaissent pendant la numérisation.
Texte d'ancre
Élément statique représentant un texte présent sur un formulaire vide, et qui n'est pas destiné à l'extraction de données. Il peut s'agir de texte explicatif ou d'un en-tête. Un texte d'ancre peut être utilisé pour l'association ou l'identification de la Définition de document.
Texte d'explication
Élément de formulaire lisible par machine qui représente un texte descriptif (nom de formulaire, noms de champs, explications de champs, etc.).
Texte dactylographié
Type de texte reconnaissable qui a été imprimé à l'aide d'un équipement typographique ou d'une imprimante laser ou à jet d'encre présentant une résolution minimale de 300 ppp.
Texte du document
Tout le texte du document qui a été capturé à partir du document pendant la reconnaissance préliminaire, avant que le FlexiLayout ne soit appliqué. Vous pouvez choisir d'enregistrer ce texte (nécessite de l'espace supplémentaire sur le disque dur) afin qu'il puisse être utilisé pendant la vérification.
Texte encadré
Type de marquage de texte selon lequel le texte est délimité par un cadre.
Afficher...
Texte encadré par-dessus un peigne
Type de marquage de texte selon lequel le texte est délimité par un cadre dont la limite inférieure est en forme de peigne.
Afficher...
Texte manuscrit en lettres d'imprimerie
Type de texte reconnaissable avec des lettres distinctes.
Texte manuscrit
Un type de texte reconnaissable avec des lettres jointes ou partiellement jointes.
Remarque : Actuellement, seul du texte écrit à la main en anglais peut être reconnu.
Texte simple
Type de marquage de texte selon lequel le texte est inséré dans un bloc sans délimiteurs.
Texte souligné
Type de marquage de texte selon lequel le texte est souligné.
Afficher...
TLN (Traitement de la langue naturelle)
Un sous-domaine de l'intelligence artificielle et de la linguistique mathématique. Concerne l'analyse informatique et la synthèse des langues naturelles. Une application possible est l'extraction d'informations utiles d'un texte. Comprend ce qui suit : traduction automatique, robots de chat, classification, analyse de tonalité, extraction de données, etc.
Type de document
Un certain nombre de documents présentant plusieurs caractéristiques communes et jouant un rôle spécifique dans les processus opérationnels.
Notons les factures, les contrats et les passeports parmi les exemples de types de documents.
Type de données
Attribut de champ décrivant les contraintes connues des valeurs de champs possibles. Il est utilisé pendant la reconnaissance des champs pour réduire le nombre de variantes de reconnaissance possibles.
Détails...
Type de données personnalisé
Type de données défini par l'utilisateur.
Type de lot
Propriété d'un lot qui définit de quelle manière doivent être traités les documents dans les lots correspondant.
V
Validation par règle
Contrôle automatique des données reconnues par rapport à un ensemble de règles prédéfinies. Consultez Validation par règle.
Variable d'environnement
Une chaîne utilisée pour stocker du texte, ex. : paramètres système. Les variables d'environnement peuvent être utilisées pour stocker des chaînes et variables de connexion de base de données utilisées lors de la définition des noms des fichiers exportés.
Vérification
La vérification consiste à s'assurer que les données ont été reconnues, que les pages ont été assemblées en documents correctement et que les règles n'ont pas généré d'erreurs. La vérification est effectuée sur le poste de vérification des données (où la précision de la reconnaissance est vérifiée) et sur le poste de vérification (où tous les types de vérification peuvent être effectués).
Vérification de champs
Mode de vérification au cours duquel les caractères reconnus sont soumis à une vérification dans le contexte d'un champ.
Détails...
Version de document
Documents appartenant au même type et partageant plusieurs caractéristiques.
Notons les factures de différents fournisseurs et les relevés de carte de crédit d'une même banque parmi les exemples de versions de document.
Version de FlexiLayout
FlexiLayout pour une version de document développé spécifiquement pour cette version de document ou formé à cette version de document. Utilisé en association avec un FlexiLayout générique.
Vérification groupée
Mode de vérification suivant lequel les caractères reconnus de manière identique sont soumis à la vérification en groupes.
Détails...
X
XFD
Définition de formulaire XML (*.xfd), un format de fichier spécifique conçu avec ABBYY FormDesigner. Un fichier au format XFD (XML Form Definition) est utilisé pour créer des définitions de document dans ABBYY FlexiCapture.
12.04.2024 18:16:03