-
À propos d'ABBYY FlexiCapture
- Nouveautés d'ABBYY FlexiCapture 12
- Types de documents traités à l'aide d'ABBYY FlexiCapture
- Brève description du traitement de document à l'aide d'ABBYY FlexiCapture
- Installation et exécution du programme
- Architecture d'ABBYY FlexiCapture
-
Configuration du programme
- Configuration d'ABBYY FlexiCapture
- Multi-tenant
-
Création d'un projet
- Propriétés de projets
- Variables d'environnement
- Importation d'image
- Types de lots
- Configuration des workflows
- Outils
- Priorité du lot par défaut
- Paramètres du SLA
- Rôles personnalisés de l'opérateur
- Paramètres d'enregistrement
- Téléchargement d'un projet vers le serveur d'application
- Tester un projet
- Paramètres des skins
- Qualité des images affichées
-
Définitions de document
- Création de définitions de document fixes
- Création d'une définition de document pour traiter des documents flexibles et non structurés
- Création d'une définition de document pour les documents ne nécessitant pas une extraction de données automatique
- Ensembles de documents
-
Les champs de définitions de documents
- Champ de saisie de texte
- Coches
- Groupes de coches
- Code barre
- Images
- Tableaux
- Groupe de champs
- Champ de service
- Champs d'index
- Lien vers un champ existant
- Champs sans région
- Création d'un champ comportant une région non rectangulaire
- Champs avec plusieurs instances
- Champ contenant plusieurs régions
- Modification du nom d'un champ
- Copie, déplacement et suppression de champs
- Exclusion d'une région de la reconnaissance
- Assistant de définition de document
- Modification et publication d'une Définition de Document
- Assemblage de documents multipages
- Propriétés de définitions de documents
- Propriétés d'une section de définition de document
- Validation par règle
- Configuration de l’exportation
- Configuration de la présentation des données dans la fenêtre de document
- Test de définitions de documents
- Localiser une Définition de document
-
Classification
- Scénarios de classification
- Profils de classification
- Équilibre précision/rappel
-
Création d'un classificateur
- Configuration du classificateur
- Configuration de votre classificateur et chargement des images
- Apprentissage des classificateurs
- Analyse des résultats de classification
- Improving your classifier
- Classification à partir de la base de données des entreprises
- Exportation et importation de classificateurs
- Mappage des catégories vers les sections de la définition de document
- Apprentissage d'extraction de champs
- Utilisation d'un projet configuré
-
ABBYY FlexiCapture pour factures
- Fonctionnalités de la reconnaissance et de l'extraction de données d'ABBYY FlexiCapture for Invoices
- Comment capturer des factures
-
Comment configurer un projet de capture de factures
- Paramètres de pays et de langues
- Connexion des bases de données d'entités commerciales et de fournisseurs
- Paramètres d'exportation de données
- Statut des documents des projets de ABBYY FlexiCapture for Invoices
- Formation d'ABBYY FlexiCapture for Invoices
- Règles
- Capturer des champs de facture supplémentaires
- Analogie des bons de commande
- Activer des fonctionnalités de programme supplémentaires pour les opérateurs
- Utiliser plusieurs Définitions de document
- Modifier les paramètres de facture des fichiers XML
- Mise à jour de la Définition de document pour les factures
- Systèmes fiscaux
- Caractéristiques techniques
- Capturing receipts
- Capturing purchase orders
- Using NLP to process unstructured documents
- Interface d'ABBYY FlexiCapture
-
Annexe
-
Utilisation de scripts sous ABBYY FlexiCapture
- Règles spécifiques aux scripts écrits en langages .Net
- Assemblages externes
- Modèle d'objet
-
Scripts permettant de personnaliser les étapes de traitement
-
Types de scripts
- Règle de script
- Script d'autocorrection
- Script d'exportation
- Script utilisateur (action personnalisée)
- Script d'assemblage de document
- Script de reconnaissance personnalisée
- Règle d'étape
- Scripts de traitement
- Script de mise à jour de jeu de données
- Script de validation de jeu de données
- Script de classification de documents
-
Gestionnaires d'événements
- Lot créé
- Lot supprimé
- Modification des paramètres du lot
- Modification de la structure d'un lot (page ajoutée/page supprimée/document ajouté/document supprimé)
- Pages déplacées
- Lot ouvert/fermé
- Vérification de l’intégrité du lot
- Modification de paramètres du document
- Modification de l'état du document
- Exportation terminée
- Scripté exécuté après la vérification des règles
- Avant l'association
- Requête de vérification de champs
-
Objets
- IActionResult
- IAssemblingError
- IAssemblingErrors
- IBatch
- IBatchCheckResults
- IBatchItem
- IBatchItems
- IBatchTypeClassifier
- IBatchTypeClassifierResult
- IBinarizationParams
- IBoxedBoolean
- ICharacterParams
- ICharactersParams
- ICheckmarkGroupValue
- ICheckmarkValue
- IDataSet
- IDataSetQuery
- IDataSetRecord
- IDocument
- IDocuments
- IDocumentExportResults
- IDocumentsExportResults
- IDocumentDefinitionInfo
- IDocumentDefinitionInfoArray
- IEditablePictureObject
- IExportFieldsToRedact
- IExportImageSavingOptions
- IField
- IFieldRegion
- IFieldRegions
- IFields
- IFlexiCaptureTools
- ILocalContrastParams
- IMatchedSectionInfo
- IMatchingInfo
- IPage
- IPageClassificationResult
- IPages
- IPictureObject
- IPictureObjectsInfo
- IPrincipal
- IPrincipals
- IProcessingCallback
- IProject
- IProperties
- IProperty
- IPropertyModificationInfo
- IRecordCheckResult
- IRecordset
- IRect
- IRects
- IRoutingRuleResult
- IRuleContext
- IRuleError
- IRuleErrors
- IRuleTag
- IRuleTags
- IScriptBinaryAttributes
- IScriptDefinitionContext
- ISectionDefinitionInfo
- ISectionDefinitionInfoArray
- IShadowsHighlightsParams
- IStageInfo
- IUserAttachment
- IUserAttachments
- IUserSessionInfo
- IValue
- IVARIANTArray
- TAssemlingErrorType
- TBatchItemType
- TColorToFilter
- TExportFieldType
- TExportType
- TImageCompressionType
- TPageClassificationType
- TPdfAVersion
- TPdfDocumentInfoType
- TPdfTextSearchAreaType
- TPrincipalType
- TProcessingPriority
- TPropertyType
- TRuleErrorType
- TStateType
- Exemples de scripts
- Noms internes des langues de reconnaissance
-
Types de scripts
-
Scripts de traitement des évènements de l'interface
-
Gestionnaires d'événements
- À la fermeture du document
- À la fermeture du projet
- À l'activation du document
- À l'activation du contrôle de champ
- Au retour de la tâche
- En cas de commande utilisateur
- À la désactivation du contrôle de champ
- À la fermeture du document
- À la fermeture de la tâche
- À la fermeture du projet
- À la modification de région
- À la modification du mode de la fenêtre Tâche
- À l'ouverture du document
- À la création de la fenêtre Tâche
- Au rejet de la tâche
- À la conception du contrôle de région
- À l'étape Envoyer vers
- À la validation du champ de texte
-
Objets
- IBoolean
- IBoxedFieldControl
- IDocumentEditor
- IDocumentItem
- IDocumentItems
- IDocumentsCollection
- IDocumentsWindow
- IDrawContext
- IErrorControl
- IErrorControls
- IErrorsWindow
- IFieldControl
- IFieldRegionControl
- IFieldRegionControls
- IFormWindow
- IImageWindow
- IMainMenu
- IMainWindow
- IMenu
- IMenuItem
- IPageControl
- IPageItem
- IPageItems
- IPagesCollection
- IPoint
- ISelection
- IShellRational
- IShellRect
- IShellRects
- ITaskWindow
- ITextEditor
- IToolbar
- IToolbarButton
- IToolbars
- TCommandBarType
- TCommandID
- TDockingType
- TDocumentState
- TErrorType
- TSelectionType
- TTaskWindowMode
- TTextSize
- TUserRole
- TWorkWindowType
-
Gestionnaires d'événements
- Script utilisateur pour le poste de vérification Web
-
Création d'un formulaire lisible par machine
- Formulaires lisibles par machine
- Éléments de formulaires lisibles par machine
- Méthodes de remplissage de formulaire
- Types de formulaires lisibles par machine
- Choix du type de formulaire adéquat
- Exigences générales pour les formulaires lisibles par machine
- Couleurs recommandées pour les formulaires simili détourés
-
Raccourcis clavier
- Raccourcis clavier de la station de configuration de projets
- Raccourcis clavier de la station de vérification
- Raccourcis clavier de la station de vérification des données
- Raccourcis clavier de l'éditeur de définition de document
- Raccourcis clavier de la fenêtre de vérification groupée
- Raccourcis clavier dans la fenêtre de vérification de champ
- Raccourcis
- Autres options
- Description des commandes du serveur de traitement
- Exemples de projets ABBYY FlexiCapture
- Langues de reconnaissance prises en charge
- Supported classifier languages
- Polices requises pour un rendu correct des caractères
- Types de textes pris en charge
- Types de codes barres pris en charge
- Formats d'entrée pris en charge
- Traiter des fichiers PDF
- Formats de fichiers d'exportation
- Formats de la date
- Caractères alphabétiques utilisés dans les expressions régulières
- Brevets
- Technologies tierces
- Glossaire
- Support technique
- Comment acheter ABBYY FlexiCapture
- Contrat de licence utilisateur final (CLUF)
-
Utilisation de scripts sous ABBYY FlexiCapture
Configuration de l'auto-apprentissage pour l'extraction de champs
L'auto-apprentissage permet au système de tirer des leçons des décisions des opérateurs lors du traitement de documents et ce, dans le but d'améliorer la détection des champs de document.
Lorsque le système ne parvient pas à trouver un champ dans un document, un opérateur peut intervenir et indiquer l'emplacement correct du champ. Une fois les documents reconnus et corrigés exportés avec succès, le système utilise les corrections apportées par l'opérateur comme entrée d'apprentissage.
Configuration de l'auto-apprentissage
Pour configurer l'auto-apprentissage, procédez aux étapes suivantes :
- Créez une définition de document.
- Dans la section Propriétés de la définition de document, sélectionnez Autoriser l'apprentissage d'extraction de champs.
- Créez les champs nécessaires de la section. Sélectionnez Peut comporter une région dans les propriétés de chaque champ.
- Enregistrez et publiez la définition de document.
- Dans la boîte de dialogue Propriétés du type de lot, cliquez sur Flux de travail pour activer l'étape Apprentissage.
Pour configurer l'auto-apprentissage pour des documents de même type, mais présentant des différences importantes d'un document à l'autre, créez des variantes pour chaque présentation particulière des champs, puis formez un classificateur pour différencier ces variantes. Pour en savoir plus sur les variantes, consultez Emplacements de champs variables dans des documents de même type.
Étapes supplémentaires nécessaires à la configuration des variantes
Pour permettre au système d’utiliser les variantes dans l’auto-apprentissage, procédez aux étapes suivantes :
- Ajoutez les variantes de section en utilisant l’une des trois méthodes suivantes :
- Créer les variantes manuellement. Pour ce faire, cliquez sur l'onglet Jeux de données dans les propriétés de la section, puis cliquez sur le bouton Afficher.... Puis cliquez sur le bouton Ajouter... pour ajouter les variantes.
- Charger les variantes à partir d'une base de données. Pour ce faire, cliquez sur l'onglet Jeux de données dans les propriétés de la section, puis cliquez sur le bouton Configurer.... Dans la liste déroulante, sélectionnez Base de données comme source de données.
- Créer des variantes à l'aide d'un script. Pour ce faire, cliquez sur Jeux de données dans les propriétés de la section, puis cliquez sur le bouton Configurer.... Dans la liste déroulante, sélectionnez Script comme source de données.
- Enregistrez et publiez la définition de document.
- Apprentissage d'un classificateur à partir des variantes nouvellement créées :
- Basculez en mode Lots d'apprentissage de classification et chargez les images de document dans un nouveau lot.
- Attribuez une catégorie de référence à chaque document, en utilisant les variantes en tant que catégories distinctes :
- Cliquez surDéfinir la catégorie... → Ajouter... → Ajouter...
- Sélectionner Préciser la variante.
- Sélectionnez une variante dans la liste.
- Formez un classificateur en cliquant sur Projet → Apprentissage de classification → Apprendre.
Lors de l'utilisation des résultats de l'apprentissage, vous devez vérifier quelle variante a été attribuée à un document et la modifier si nécessaire. Pour afficher les identifiants des variantes sur le formulaire, créez un champ de service. Pour plus de détails, consultez Autoriser les opérateurs à modifier les variantes.
Remarque :L'apprentissage d'extraction de champ peut également être effectué par l'administrateur si un projet doit faire l'objet d'un apprentissage avant que les opérateurs ne commencent à travailler dessus.
Après la configuration de la définition de document par l'administrateur, le système tire automatiquement les leçons des corrections apportées par les opérateurs des postes de vérification.
La procédure d'auto-apprentissage
Après la vérification et la rectification des emplacements de leurs champs par les opérateurs, les documents sont placés dans un lot d'apprentissage.
Les documents sont mis en correspondance avec la version actuelle de FlexiLayout formée. Si tous les champs sont trouvés correctement, il n'est pas nécessaire de soumettre FlexiLayout à un nouvel apprentissage.
Remarque : Il est également possible que FlexiLayout trouve les champs correctement, mais que l'opérateur ait dû les modifier. Les documents ont été traités à l'aide d'une version ancienne ou non formée de FlexiLayout. Pendant que les documents étaient en attente de vérification, le système a formé FlexiLayout à partir d’autres documents. En conséquence, les documents donnés sont maintenant traités correctement.
Dans ce cas, les documents sont conservés dans le lot d'apprentissage avec le statut Pour test. Ils seront utilisés pour des tests de régression afin d’éviter la dégradation des versions ultérieures de FlexiLayout.
Si un FlexiLayout formé est appliqué et que certaines régions de champ ne correspondent pas, les documents seront utilisés pour former une nouvelle version de FlexiLayout. Le statut Pour apprentissage leur sera affecté.
Les résultats d'apprentissage constituent une nouvelle version de FlexiLayout. Pour comparer la nouvelle version et la version précédente, les deux sont appliquées aux documents du lot d'apprentissage avec les statuts Pour apprentissage et Pour test. Le système vérifie dans quelle mesure les régions de champ détectées correspondent à la présentation confirmée par l'utilisateur. Le FlexiLayout qui fournit la meilleure correspondance sera utilisé dans le traitement ultérieur des documents et la version la moins performante sera supprimée.
14.01.2021 14:17:20