Détecter les champs principaux
Cet article explique comment les champs principaux d'une facture sont détectés et capturés.
Le programme commence à traiter une facture en préreconnaissant son texte en fonction des paramètres de Définition de document :
- Le mode de préreconnaissance (Rapide / Équilibré / Normal / Exacte) étermine la vitesse de la préreconnaissance et la qualité de la couche de texte obtenue en résultat. Pour spécifier un mode de préreconnaissance, dans l'éditeur de Définitions de document, cliquez sur Définition de document → Propriétés de la définition de document... → Reconnaissance).
- Les langues de préreconnaissance sont les langues à utiliser pour la préreconnaissance. Pour spécifier les langues de préreconnaissance dans l'éditeur de Définitions de document, cliquez sur Définition de document → Propriétés de la définition de document... → Paramètres de définition de document, puis cliquez sur éditer dans le groupe Pays et langues pour sélectionner les langues requises.
Remarque : Dans FlexiCapture pour les factures, les langues de reconnaissance sont liées aux paramètres propres à chaque pays. Lors de l'ajout d'un pays de facturation au groupe Pays et langues, les langues correspondantes apparaissent automatiquement dans les paramètres de Définition de document. Les champs de la facture sont extraits lors de la reconnaissance.
Pour détecter et acquérir des champs d'une facture, le programme peut utiliser :
Ces deux méthodes sont décrites ci-dessous, ainsi que l'algorithme qui soit combine les résultats obtenus par l'utilisation de ces deux méthodes, soit sélectionne le meilleur résultat.
Utilisation d’un FlexiLayout
Entité commerciale et fournisseur
Utiliser des valeurs de fournisseur et d'entité commerciale pré-déterminées conjointement à des valeurs extraites
Le fournisseur ou l'entité commerciale de la société de la facture peut être déterminé(e) à l'avance en se basant sur la source de la facture (nom de l'opérateur de numérisation ou adresse électronique de l'expéditeur du message).
Vous pouvez spécifier le fournisseur et/ou l'entité commerciale explicitement avant la détection automatique.
Pour ce faire, définissez la valeur du paramètre d'enregistrement des documents fc_Predefined:InvoicePredefinedVendorId (fc_Predefined:InvoicePredefinedBusinessUnitId) sur l'identificateur (Id) d'une entrée dans le Jeu de données Fournisseurs et Entités commerciales.
Procéder ainsi n'empêche pas la détection automatique du fournisseur et/ou de l'entité commerciale de se dérouler. Grâce à cela, en plus du fournisseur et/ou de l'entité commerciale pré-déterminés, vous obtiendrez une valeur de confiance (cette valeur indique dans quelle mesure les valeurs pré-déterminées correspondent aux valeurs extraites de l'image), ainsi que les régions des champs des groupes Fournisseur et/ou Entité commerciale.
Groupe de champs dans l'en-tête de facture
Le groupe de champs Montants
Le groupe de champs Bons de commande
Le groupe de champs éléments de ligne
Utilisation des réseaux neuronaux
L'un des principaux avantages qu'offrent les réseaux neuronaux est leur capacité d'auto-apprentissage : les réseaux neuronaux peuvent détecter les dépendances complexes existant entre les données d'entrée et procéder à quelques généralisations utiles.
Le programme comprend deux réseaux neuronaux qui peuvent être utilisés pour l'acquisition des champs suivants :
- InvoiceNumber
- InvoiceDate
- Total
- Fournisseur \ Nom
- Fournisseur \ Adresse
- Unité opérationnelle \ Nom
- Unité opérationnelle \ Adresse
- Bons de commande \ Numéro de commande
- LineItems :
- OrderNumber
- OrderDate
- Position
- NuméroArticle
- Description
- Quantité
- Unité de mesure
- Prix unitaire
- Total net
- VATPercentage
Pour une précision maximale, le programme utilise à la fois un FlexiLayout et ses réseaux neuronaux pour l'acquisition des champs des factures. Les champs que le programme ne réussit pas à extraire à l'aide de ses réseaux neuronaux seront extraits à l'aide du FlexiLayout. Si un champ peut être extrait à la fois par les réseaux neuronaux et par le FlexiLayout, le programme effectuera une combinaison intelligente des résultats obtenus par les deux méthodes. Le mode de combinaison des résultats dépend du champ (pour plus de détails, consultez Combinaison des résultats de la détection de champs).
Désactivation des réseaux neuronaux
Par défaut, les réseaux neuronaux seront utilisés comme deuxième méthode d'acquisition des champs des documents. Si, dans le cadre de votre projet Factures, vous devez traiter des documents autres que des factures, vous souhaiterez peut-être désactiver le réseau neuronal, car celui-ci ayant été spécifiquement formé pour l'acquisition des champs des factures, il risque de ne pas fonctionner correctement sur d'autres types de documents.
Pour la désactivation du réseau neuronal pour le groupe Éléments de ligne :
- ouvrez l'éditeur de Définitions de documents.
- Cliquez sur Propriétés de la définition de document...→Paramètres de définition de document→Champs et caractéristiques supplémentaires.
- Désactivez l'option Éléments avancés de ligne de facture.
Pour désactiver le réseau neuronal pour les groupes En-tête de facture, Fournisseur, Unité opérationnelle et Bons de commande :
- ouvrez l'éditeur de Définitions de documents.
- Cliquez sur Propriétés de la définition de document...→ Paramètres de définition de document→ Champs et caractéristiques supplémentaires.
- Désactivez l'option Champs avancés d'en-têtes de facture.
Combinaison des résultats de la détection de champs
La façon dont le programme combine les résultats de la détection de champs ou sélectionne le meilleur résultat dépend du champ. La règle générale est que la priorité est donnée aux résultats obtenus par le réseau neuronal concerné. Les exceptions à cette règle sont les recherches basées sur des jeux de données et les recherches utilisant des expressions régulières créées pour des documents spécifiques de clients.
Groupe du champ En-tête de facture
Les résultats obtenus par le réseau neuronal seront toujours prioritaires pour les champs suivants :
- Numéro de facture
- Date de facture
- Total
Unité opérationnelle et fournisseur
Par défaut, l'unité opérationnelle et le fournisseur sont détectés sur la base d'un jeu de données, sous réserve de la sélection de l'un d'entre eux.
De plus, les champs suivants peuvent être détectés à l'aide du réseau neuronal en l'absence de tout enregistrement correspondant dans le jeu de données :
- Nom
- VATID (ABN)
- Adresse
Si aucun jeu de données n'est sélectionné, seul le réseau neuronal sera utilisé.
Groupe du champ Bon de commande
Le réseau neuronal sera utilisé seulement si la valeur n'est pas détectée à l'aide d'un jeu de données ou d'une expression régulière.
Éléments de ligne
Pour les champs Élément de ligne, la priorité est donnée aux résultats obtenus par le réseau neuronal. Si le réseau neuronal détecte la totalité du tableau des éléments de ligne, ce tableau sera utilisé pour un traitement ultérieur. Sinon, le programme utilisera les éléments de ligne détectés à l'aide du FlexiLayout.
Si le réseau neuronal détecte uniquement les champs Description et TotalPriceNetto de chaque élément de ligne, ils seront complétés par les champs détectés à l'aide du FlexiLayout.
12.04.2024 18:16:04