Méthode de fusion des résultats de FlexiLayouts différents
Cette section décrit l'ordre dans lequel les FlexiLayouts sont appliqués aux factures et comment les régions de champ sont sélectionnées.
Une définition de document dans ABBYY FlexiCapture for Invoices peut inclure les types et sous-types suivants de FlexiLayout :
1. FlexiLayout générique, qui est utilisé pour traiter toutes les factures, et qui, à son tour, inclut deux types de FlexiLayout :
a. FlexiLayout principal, qui est utilisé pour détecter les champs de facture standard déjà définis dans le programme (ce FlexiLayout est fourni avec ABBYY FlexiCapture for Invoices et ne peut pas être modifié) ;
b. FlexiLayout supplémentaire, qui est utilisé pour détecter les champs définis par l'utilisateur et les champs de facture standard pour lesquels l'utilisateur a modifié l'algorithme de détection (ce FlexiLayout est créé par l'utilisateur).
2. Versions de FlexiLayout utilisées pour traiter les factures de fournisseurs spécifiques. Les versions de FlexiLayout peuvent être utilisées pour détecter des champs définis dans leur définition de document respective et elles peuvent être créées par l'utilisateur ou par ABBYY FlexiCapture for Invoices après un apprentissage axé sur les factures de fournisseurs spécifiques.
Après l'application d'une définition de document à une facture, le programme obtient un ensemble de régions de champ tel que détecté par les différents types de FlexiLayout inclus dans la définition de document.
1. Application du FlexiLayout générique
A. Dans un premier temps, le programme applique le FlexiLayout principal.
Paramètres de préreconnaissance
L'image de document est préreconnue à l'aide des paramètres spécifiés dans la Définition de document :
- Les langues sont spécifiées sous Pays et langues dans l'onglet Paramètres de définition de document de la boîte de dialogue Propriété de la définition de document.
- Le mode de préreconnaissance (Rapide, Équilibré, Normal ou Exacte) de l'onglet FlexiLayout de la boîte de dialogue Propriétés de la Définition document.
Résultats obtenus par l'application du FlexiLayout principal
Après l'application du FlexiLayout principal, le programme obtient :
- l'ID du fournisseur et de l'entité commerciale, s'ils sont détectés ;
- les régions des champs standard. (Voir Champs capturés pour plus de détails).
B. Ensuite, le programme applique le FlexiLayout supplémentaire, s'il est disponible dans le FlexiLayout générique.
Paramètres de préreconnaissance
L'image de document est préreconnue à l'aide de paramètres (c-à-d, des langues et du mode de préreconnaissance à utiliser) spécifiés dans le FlexiLayout. Nous vous recommandons de spécifier les mêmes paramètres de préreconnaissance dans le FlexiLayout supplémentaire et dans la Définition de document. Dans ce cas, le programme utilisera le résultat de reconnaissance préliminaire obtenu à l'étape 1A au lieu de procéder à deux reconnaissances préliminaires de la facture.
Pour traiter certains champs inhabituels, vous voudrez peut-être spécifier des paramètres de préreconnaissance différents de ceux de la Définition de document dans le FlexiLayout supplémentaire. Cependant, si vous procédez ainsi, cela ralentira le traitement.
Résultats obtenus par l'application du FlexiLayout supplémentaire
Après l'application du FlexiLayout supplémentaire, le programme obtient les régions de tous les champs définis dans le FlexiLayout supplémentaire. Il peut s'agir de champs de facture standard, pour lesquels l'algorithme de détection a dû être modifié, ou de champs supplémentaires qui n'ont pas été définis dans le FlexiLayout principal.
C. Ensuite, le programme génère le résultat global de l'application du FlexiLayout générique. Si la définition de document inclut un FlexiLayout supplémentaire, à ce stade, le programme fusionne les résultats obtenus en appliquant le FlexiLayout principal et les résultats obtenus en appliquant le FlexiLayout supplémentaire.
Les champs sont identifiés par leur nom. Le résultat est un ensemble de champs uniques issus du FlexiLayout principal et du FlexiLayout supplémentaire. Si des champs ont le même nom dans le FlexiLayout principal et le FlexiLayout supplémentaire, le programme utilisera la région de champ obtenue par l'association du FlexiLayout supplémentaire.
Cette approche vous permet de définir de nouveaux champs ou de changer la logique de capture de l'un des champs de facture standard.
2. Application des versions de FlexiLayout
Si, lors de l'application du FlexiLayout générique à l'étape 1, le programme réussit à détecter le fournisseur et qu'une version de FlexiLayout est disponible pour ce fournisseur, celle-ci est appliquée à ce stade.
Paramètres de préreconnaissance
Les paramètres de préreconnaissance de la Définition de document sont utilisés. Les paramètres de la reconnaissance préliminaire étant les mêmes que ceux utilisés lors de l'application du FlexiLayout principal inclus dans le FlexiLayout générique, aucune reconnaissance préliminaire supplémentaire n'est requise.
Résultats obtenus par l'application de la version de FlexiLayout
Après l'application de la version de FlexiLayout, le programme obtient les régions de tous les champs définis dans la version de FlexiLayout. Notez que si une variante de FlexiLayout a été obtenue en formant le programme sur un type de facture, elle comprendra tous les champs définis dans la Définition de document. Par ailleurs, si vous créez une variante de FlexiLayout manuellement, seuls les champs dont la détection requiert certaines opérations spécifiques au fournisseur donné doivent figurer dans la variante.
3. Fusion des résultats
À ce stade, les résultats obtenus par l'application du FlexiLayout générique sont fusionnés avec les résultats obtenus par l'application de la version de FlexiLayout.
Si la variante de FlexiLayout a été obtenue en formant le programme sur un type de facture, elle comprendra tous les champs définis dans la Définition de document. La Définition de document stocke des informations concernant les champs dont les régions ont dû être modifiées par l'utilisateur lors de la formation, c-à-d, les champs qui ont mal été détectés par le FlexiLayout générique. Le programme s'appuiera sur ces informations pour choisir les régions de champs à prélever dans le FlexiLayout et les régions de champ à prélever dans la variante de FlexiLayout.
Remarque : Les régions des champs Montant sont sélectionnées différemment. Lors de l'application du FlexiLayout générique, le programme spécifiera le niveau de confiance de la détection des régions des champs Montant. Si les régions sont mal détectées, le champ Total devra être vérifié. Si une version de FlexiLayout a fait l'objet d'un apprentissage axé sur les factures du fournisseur donné et si le niveau de confiance de la détection des champs Montant par le FlexiLayout générique n'est pas suffisant ou s'il n'a pas réussi à les détecter, les régions des champs Montant détectées par la version de FlexiLayout seront utilisées. Vous pouvez également configurer le programme pour toujours utiliser les régions des champs Montant détectées par la version de FlexiLayout. Pour ce faire, réglez la valeur de la clé de registre [HKEY_CURRENT_USER\Software\ABBYY\FlexiCapture\12.0\DAForms\]« UseTrainedInvoiceAmounts » sur true (la clé est réglée sur false par défaut).
Si la variante de FlexiLayout a été créée manuellement, le programme utilisera les régions de tous les champs qu'elle inclut. Les régions de tout autre champ sont extraites des résultats obtenus par l'application du FlexiLayout générique.
Des informations indiquant le FlexiLayout qui a été utilisé pour détecter la région d'un champ sont enregistrées dans le journal de reconnaissance
Exemple
12.04.2024 18:16:03