-
À propos d'ABBYY FlexiCapture
- Nouveautés d'ABBYY FlexiCapture 12
- Types de documents traités à l'aide d'ABBYY FlexiCapture
- Brève description du traitement de document à l'aide d'ABBYY FlexiCapture
- Installation et exécution du programme
- Architecture d'ABBYY FlexiCapture
-
Configuration du programme
- Configuration d'ABBYY FlexiCapture
- Multi-tenant
-
Création d'un projet
- Propriétés de projets
- Variables d'environnement
- Importation d'image
- Types de lots
- Configuration des workflows
- Outils
- Priorité du lot par défaut
- Paramètres du SLA
- Rôles personnalisés de l'opérateur
- Paramètres d'enregistrement
- Téléchargement d'un projet vers le serveur d'application
- Tester un projet
- Paramètres des skins
- Qualité des images affichées
-
Définitions de document
- Création de définitions de document fixes
- Création d'une définition de document pour traiter des documents flexibles et non structurés
- Création d'une définition de document pour les documents ne nécessitant pas une extraction de données automatique
- Ensembles de documents
-
Les champs de définitions de documents
- Champ de saisie de texte
- Coches
- Groupes de coches
- Code barre
- Images
- Tableaux
- Groupe de champs
- Champ de service
- Champs d'index
- Lien vers un champ existant
- Champs sans région
- Création d'un champ comportant une région non rectangulaire
- Champs avec plusieurs instances
- Champ contenant plusieurs régions
- Modification du nom d'un champ
- Copie, déplacement et suppression de champs
- Exclusion d'une région de la reconnaissance
- Assistant de définition de document
- Modification et publication d'une Définition de Document
- Assemblage de documents multipages
- Propriétés de définitions de documents
- Propriétés d'une section de définition de document
- Validation par règle
- Configuration de l’exportation
- Configuration de la présentation des données dans la fenêtre de document
- Test de définitions de documents
- Localiser une Définition de document
-
Classification
- Scénarios de classification
- Profils de classification
- Équilibre précision/rappel
-
Création d'un classificateur
- Configuration du classificateur
- Configuration de votre classificateur et chargement des images
- Apprentissage des classificateurs
- Analyse des résultats de classification
- Improving your classifier
- Classification à partir de la base de données des entreprises
- Exportation et importation de classificateurs
- Mappage des catégories vers les sections de la définition de document
- Apprentissage d'extraction de champs
- Utilisation d'un projet configuré
-
ABBYY FlexiCapture pour factures
- Fonctionnalités de la reconnaissance et de l'extraction de données d'ABBYY FlexiCapture for Invoices
- Comment capturer des factures
-
Comment configurer un projet de capture de factures
- Paramètres de pays et de langues
- Connexion des bases de données d'entités commerciales et de fournisseurs
- Paramètres d'exportation de données
- Statut des documents des projets de ABBYY FlexiCapture for Invoices
- Formation d'ABBYY FlexiCapture for Invoices
- Règles
- Capturer des champs de facture supplémentaires
- Analogie des bons de commande
- Activer des fonctionnalités de programme supplémentaires pour les opérateurs
- Utiliser plusieurs Définitions de document
- Modifier les paramètres de facture des fichiers XML
- Mise à jour de la Définition de document pour les factures
- Systèmes fiscaux
- Caractéristiques techniques
- Capturing receipts
- Capturing purchase orders
- Using NLP to process unstructured documents
- Interface d'ABBYY FlexiCapture
-
Annexe
-
Utilisation de scripts sous ABBYY FlexiCapture
- Règles spécifiques aux scripts écrits en langages .Net
- Assemblages externes
- Modèle d'objet
-
Scripts permettant de personnaliser les étapes de traitement
-
Types de scripts
- Règle de script
- Script d'autocorrection
- Script d'exportation
- Script utilisateur (action personnalisée)
- Script d'assemblage de document
- Script de reconnaissance personnalisée
- Règle d'étape
- Scripts de traitement
- Script de mise à jour de jeu de données
- Script de validation de jeu de données
- Script de classification de documents
-
Gestionnaires d'événements
- Lot créé
- Lot supprimé
- Modification des paramètres du lot
- Modification de la structure d'un lot (page ajoutée/page supprimée/document ajouté/document supprimé)
- Pages déplacées
- Lot ouvert/fermé
- Vérification de l’intégrité du lot
- Modification de paramètres du document
- Modification de l'état du document
- Exportation terminée
- Scripté exécuté après la vérification des règles
- Avant l'association
- Requête de vérification de champs
-
Objets
- IActionResult
- IAssemblingError
- IAssemblingErrors
- IBatch
- IBatchCheckResults
- IBatchItem
- IBatchItems
- IBatchTypeClassifier
- IBatchTypeClassifierResult
- IBinarizationParams
- IBoxedBoolean
- ICharacterParams
- ICharactersParams
- ICheckmarkGroupValue
- ICheckmarkValue
- IDataSet
- IDataSetQuery
- IDataSetRecord
- IDocument
- IDocuments
- IDocumentExportResults
- IDocumentsExportResults
- IDocumentDefinitionInfo
- IDocumentDefinitionInfoArray
- IEditablePictureObject
- IExportFieldsToRedact
- IExportImageSavingOptions
- IField
- IFieldRegion
- IFieldRegions
- IFields
- IFlexiCaptureTools
- ILocalContrastParams
- IMatchedSectionInfo
- IMatchingInfo
- IPage
- IPageClassificationResult
- IPages
- IPictureObject
- IPictureObjectsInfo
- IPrincipal
- IPrincipals
- IProcessingCallback
- IProject
- IProperties
- IProperty
- IPropertyModificationInfo
- IRecordCheckResult
- IRecordset
- IRect
- IRects
- IRoutingRuleResult
- IRuleContext
- IRuleError
- IRuleErrors
- IRuleTag
- IRuleTags
- IScriptBinaryAttributes
- IScriptDefinitionContext
- ISectionDefinitionInfo
- ISectionDefinitionInfoArray
- IShadowsHighlightsParams
- IStageInfo
- IUserAttachment
- IUserAttachments
- IUserSessionInfo
- IValue
- IVARIANTArray
- TAssemlingErrorType
- TBatchItemType
- TColorToFilter
- TExportFieldType
- TExportType
- TImageCompressionType
- TPageClassificationType
- TPdfAVersion
- TPdfDocumentInfoType
- TPdfTextSearchAreaType
- TPrincipalType
- TProcessingPriority
- TPropertyType
- TRuleErrorType
- TStateType
- Exemples de scripts
- Noms internes des langues de reconnaissance
-
Types de scripts
-
Scripts de traitement des évènements de l'interface
-
Gestionnaires d'événements
- À la fermeture du document
- À la fermeture du projet
- À l'activation du document
- À l'activation du contrôle de champ
- Au retour de la tâche
- En cas de commande utilisateur
- À la désactivation du contrôle de champ
- À la fermeture du document
- À la fermeture de la tâche
- À la fermeture du projet
- À la modification de région
- À la modification du mode de la fenêtre Tâche
- À l'ouverture du document
- À la création de la fenêtre Tâche
- Au rejet de la tâche
- À la conception du contrôle de région
- À l'étape Envoyer vers
- À la validation du champ de texte
-
Objets
- IBoolean
- IBoxedFieldControl
- IDocumentEditor
- IDocumentItem
- IDocumentItems
- IDocumentsCollection
- IDocumentsWindow
- IDrawContext
- IErrorControl
- IErrorControls
- IErrorsWindow
- IFieldControl
- IFieldRegionControl
- IFieldRegionControls
- IFormWindow
- IImageWindow
- IMainMenu
- IMainWindow
- IMenu
- IMenuItem
- IPageControl
- IPageItem
- IPageItems
- IPagesCollection
- IPoint
- ISelection
- IShellRational
- IShellRect
- IShellRects
- ITaskWindow
- ITextEditor
- IToolbar
- IToolbarButton
- IToolbars
- TCommandBarType
- TCommandID
- TDockingType
- TDocumentState
- TErrorType
- TSelectionType
- TTaskWindowMode
- TTextSize
- TUserRole
- TWorkWindowType
-
Gestionnaires d'événements
- Script utilisateur pour le poste de vérification Web
-
Création d'un formulaire lisible par machine
- Formulaires lisibles par machine
- Éléments de formulaires lisibles par machine
- Méthodes de remplissage de formulaire
- Types de formulaires lisibles par machine
- Choix du type de formulaire adéquat
- Exigences générales pour les formulaires lisibles par machine
- Couleurs recommandées pour les formulaires simili détourés
-
Raccourcis clavier
- Raccourcis clavier de la station de configuration de projets
- Raccourcis clavier de la station de vérification
- Raccourcis clavier de la station de vérification des données
- Raccourcis clavier de l'éditeur de définition de document
- Raccourcis clavier de la fenêtre de vérification groupée
- Raccourcis clavier dans la fenêtre de vérification de champ
- Raccourcis
- Autres options
- Description des commandes du serveur de traitement
- Exemples de projets ABBYY FlexiCapture
- Langues de reconnaissance prises en charge
- Supported classifier languages
- Polices requises pour un rendu correct des caractères
- Types de textes pris en charge
- Types de codes barres pris en charge
- Formats d'entrée pris en charge
- Traiter des fichiers PDF
- Formats de fichiers d'exportation
- Formats de la date
- Caractères alphabétiques utilisés dans les expressions régulières
- Brevets
- Technologies tierces
- Glossaire
- Support technique
- Comment acheter ABBYY FlexiCapture
- Contrat de licence utilisateur final (CLUF)
-
Utilisation de scripts sous ABBYY FlexiCapture
Analyse des résultats de classification
À la fin de l'apprentissage, les données statistiques sont enregistrées. L'analyse des statistiques peut vous aider à mieux comprendre comment vous pouvez améliorer la qualité du classificateur. Vous pouvez ouvrir la boîte de dialogue des statistiques de classification soit en :
- sélectionnant Apprentissage de la classification → View Statistics dans le menu principal ;
- soit en cliquant sur le bouton
Statistiques de la barre d'outils.
Les informations suivantes peuvent être consultées dans la nouvelle fenêtre :
- Mesure F, Rappel et Précision : plus ces valeurs sont élevées, plus les résultats de la classification sont précis. (Pour plus de détails sur le calcul de la mesure F, référez-vous à Glossaire, Mesure F de la classification) ;
- le nombre de pages avec les catégories de référence ;
- les résultats de la classification de la page :
- Vrai positif, en d'autres termes, le nombre de pages auxquelles une catégorie correspondant à la catégorie de référence a été attribuée.
- Faux positif, en d'autres termes, le nombre de pages auxquelles une catégorie ne correspondant pas à la catégorie de référence a été attribuée.
- Faux négatif, en d'autres termes, le nombre de pages avec une catégorie de référence auxquelles aucune catégorie n'a été attribuée.
- Vrai négatif, en d'autres termes, le nombre de pages sans aucune catégorie de référence auxquelles aucune catégorie n'a été attribuée.
À l'aide de la liste déroulante dans le coin supérieur gauche de la fenêtre Statistiques de classification, choisissez si vous souhaitez afficher les statistiques pour les pages Pour test, pour les pages Pour apprentissage ou pour les deux.
Les informations détaillées sur le ratio entre les catégories de référence et les catégories de résultats, ainsi que les informations sur les résultats de l'apprentissage du classificateur, sont présentées sous trois formes différentes :
1. Matrice de confusion. La matrice de confusion est une représentation visuelle des documents le plus souvent confondus par un classificateur. Les valeurs figurant dans les cellules de la matrice représentent les ratios entre les catégories de référence et les catégories de résultats. Les cellules vertes indiquent le nombre de pages auxquelles une catégorie a été correctement attribuée. Les cellules rouges indiquent le nombre de pages avec des catégories confondues, en d'autres termes, des catégories que le classificateur a attribuées de manière incorrecte à des pages ayant une catégorie de référence.
Outils pour travailler avec la matrice de confusion
- L'option Confused only désactive l'affichage des catégories, lorsque les catégories de résultats de toutes les pages correspondent à leur catégorie de référence.
- Les boutons Pages et Percent permettent à l'utilisateur d'alterner entre les données sous forme de nombre et de pourcentage en ce qui concerne le nombre de pages avec des catégories correctement identifiées et le nombre de celles avec des catégories confondues (le pourcentage est calculé en utilisant le ratio entre les pages auxquelles une catégorie a été correctement attribuée et toutes les pages ayant la même catégorie de référence).
- L'échelle de la matrice peut être gérée comme suit :
- affiche la matrice à l'aide d'une échelle fixe ;
- affiche la matrice dans son intégralité ;
- zoom avant ;
- zoom arrière.
2. Statistiques par catégorie. Un tableau dans lequel figurent les statistiques relatives aux pages pour lesquelles la catégorie de résultat ne correspond pas à la catégorie de référence. Permet à l'utilisateur d'identifier les catégories qui génèrent le plus d'erreurs au niveau d'un classificateur donné. Vous pouvez trier par nombre de pages confondues, ainsi que par le ratio entre le nombre de pages confondues et le nombre total de pages de cette catégorie de référence.
3. Catégories de confusion. Cet onglet contient une liste de toutes les catégories qu'un classificateur a attribuées de manière erronée. À l'aide de ces données, vous pouvez déterminer quelles sont les catégories le plus souvent confondues les unes avec les autres.
Pour ouvrir les pages des catégories sélectionnées, double-cliquez sur une cellule de la matrice ou sur une ligne du tableau de données. La ligne de recherche des catégories de référence se trouve dans tous les onglets. Vous pouvez également trier n'importe quelle tableau de données pour savoir quelles sont les catégories qui posent le plus de problèmes.
À votre convenance, vous pouvez exporter les statistiques dans un fichier texte en cliquant sur Exporter les statistiques... dans la boîte de dialogue Statistiques de classification. Dans la boîte de dialogue qui s'affiche, spécifiez un nom et un emplacement pour le fichier exporté et choisissez si vous souhaitez l'enregistrer en tant que fichier CSV ou TXT. Vous pouvez également choisir les statistiques à exporter (sélectionnez une ou plusieurs options) :
- les statistiques récapitulatives des principaux paramètres de la classification : les résultats de mesure F, rappel, précision et classification ventilés par page.
- principaux paramètres de la classification ventilés par catégorie.
- catégories de confusion : le nombre et le pourcentage de pages pour chaque catégorie de confusion.
- toutes les catégories : le nombre et le pourcentage de pages pour chaque catégorie.
Les statistiques seront exportées seulement pour les pages pour lesquelles l'état du document est sélectionné dans la boîte de dialogue Statistiques de classification.
Important !Vous devez réinitialiser l'apprentissage du classificateur si l'une des actions suivantes a été effectuée :
- ajout/suppression de documents ayant la Pour apprentissage attribuée ;
- attribution du statut Pour apprentissage a un document ou sa suppression de celui-ci ;
- ajout, suppression ou fusion des catégories ;
- attribution d'une catégorie de référence différente à un document ;
- modification d'un profil de classification et/ou de la priorité de précision/rappel.
14.01.2021 14:17:20