Création d'une définition de document pour les documents ne nécessitant pas une extraction de données automatique

Une définition de document sans extraction de champ automatique peut être utile dans les cas suivants :

  • Lors du traitement de documents qui doivent toujours être présents dans un ensemble de documents mais à partir desquels aucune donnée ne doit ou ne peut être extraite. Parmi les exemples, mentionnons les déclarations manuscrites, les avis, etc.
  • Lorsque vous devez classer et trier des documents sans extraire leurs données.

Dans les cas similaires à ceux décrits ci-dessus, vous pouvez créer une définition de document selon laquelle ses documents ignoreront l'étape d'analyse. Cela réduira la charge de travail de l'opérateur de vérification et accélérera le traitement.

Pour créer une définition de document sans extraction automatique de champ, les conditions suivantes doivent être remplies :

  • Vos documents ne doivent contenir ni ancre ni identificateur (sinon, ils seront traités comme des formulaires fixes).
  • Aucun FlexiLayout ne doit être chargé.
  • L'apprentissage de champ doit être désactivé.

Dans Assistant de définition de document, sélectionnez Documents qui ne nécessitent pas d'extraction automatique des données comme type de document. Par conséquent, une définition de document avec une seule section sera créée et tous les documents ne nécessitant pas une extraction automatique de données ne passeront pas par l'étape d'analyse.

En règle générale, ce type de document ne nécessite pas l'OCR. Si vous prévoyez d'utiliser l'indexation manuelle ou si vous souhaitez que vos opérateurs de vérification puissent entrer du texte en cliquant dessus sur l'image, vous devez vous assurer que vos documents comportent un calque de texte. Pour ajouter un calque de texte à vos documents, créez au moins un champ avec l'option Peut comporter une région sélectionnée.

Remarque :  Sinon, un calque de texte peut être ajouté à l'étape d'exportation en sélectionnant l’option Créer un fichier PDF interrogeable.

Toute définition de document peut être modifiée pour empêcher l'extraction automatique de champ. Tout ce que vous avez à faire est de retirer toutes les ancres et les FlexiLayout et de désactiver l’apprentissage de champ.

12.04.2024 18:16:04

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.