Création d'une définition de document pour traiter des documents flexibles et non structurés

ABBYY FlexiCapture peut servir à traiter des documents non structurés contenant des informations sous une forme libre, par exemple des contrats, des lettres, des commandes et des annexes. Les documents non structurés contenant du texte ou des images séparés par des feuilles vierges ou des pages avec des codes barres sont traités et exportés sous forme de fichiers PDF indexés  ou de fichiers graphiques.

Le traitement de documents de ce type implique habituellement de convertir les documents sous une forme électronique et d'effectuer une recherche à partir des valeurs de champs clés.

Si c'est possible, la recherche des champs clés (tels qu'un numéro de contrat) au sein de ces documents est effectuée à l'aide d'une description flexible créée avec ABBYY FlexiLayout Studio. Consultez la section Création d'une définition de document pour traiter des documents flexibles.

Le TLN peut être utilisé pour le traitement des documents non structurés. Cette technologie fait appel à des modèles de TLN pour l'extraction des informations du texte.

Si la recherche automatique de champs clés est impossible, l'opérateur peut entrer les valeurs manuellement. Pour ce faire, créez une définition de document avec un champ (ou plusieurs, si nécessaire) et activez l'option Ne pas reconnaître (clé du champ d'image - sera entré manuellement) dans les propriétés de reconnaissance de ce champ. Quand il exécute le processus de vérification, l'opérateur peut ensuite entrer les valeurs des champs manuellement.

Vous devez configurer l'exportation pour activer le stockage de données : vous pouvez exporter les valeurs des champs clés vers un fichier ou une base de données, puis enregistrer les images de document sous un format plus pratique. Vous pouvez enregistrer les images de document sous forme de fichiers graphiques ou de fichiers PDF indexés.

Soyez vigilant lorsque vous assemblez des pages sous forme de documents : avec les documents non structurés, il peut être difficile de savoir de quel document une page donnée fait partie. Pour automatiser l'assemblage des documents non structurés, nous recommandons de séparer les documents à l'aide de feuilles vierges ou de pages contenant des codes barres. Lorsque vous ajoutez des images à un lot (en les numérisant, en les ajoutant à partir d'un fichier ou en créant un profil d'importation), vous devez activer l'option Pour les images séparées par et sélectionner la valeur pages vierges ou pages avec code barre dans la liste déroulante, en fonction des pages à utiliser comme séparateurs. Les pages sont assemblées automatiquement sous forme de documents : elles sont ajoutées au document en cours jusqu'à la page de séparation suivante. Pour plus d'informations, consultez la section Ajout d'images de pages.

4/13/2021 11:12:29 AM


Please leave your feedback about this article