Utilisation de modèles pour l'indexation

Dans ABBYY FineReader Server 14, vous pouvez utiliser des modèles de région de champ pour remplir automatiquement les champs d'index. Les modèles de région de champ peuvent également être utilisés pour accélérer l'indexation manuelle.

Un modèle stocke les informations relatives à l'emplacement de chaque région de champ d'où les informations doivent être extraites aux fins de l'indexation. Des modèles peuvent être créés pour les documents contenant le même ensemble de régions de champs et leurs champs d'index correspondants.

Création d'un modèle

Pour créer un modèle, vous devez indexer manuellement plusieurs documents de même type et enregistrer les résultats dans un fichier modèle. Pour ce faire :

  1. Dans la console d'administration à distance, ouvrez la boîte de dialogue des Propriétés du workflow.
  2. Dans l'onglet Indexation, ajoutez le nouveau type de document et les champs d'index souhaités.
  3. Commencez le traitement de plusieurs des documents pour lesquels vous souhaitez créer un modèle.
    Astuce. À des fins pratiques, vous pouvez fusionner plusieurs documents en un seul fichier. Cela facilitera la configuration de votre modèle.
  4. Ouvrez le fichier sur le poste d'indexation.
  5. Cliquez sur Outils > Modèle de région de champ pour ouvrir l'éditeur de modèle.
  6. Sélectionnez l'outil Texte.
    1. Sélectionnez une région de champ sur la page.
    2. Cliquez avec le bouton droit de la souris sur la région de champ sélectionnée et choisissez le champ d'index correspondant dans le menu contextuel.
    3. Répétez les étapes a et b pour chacun des champs d'index de ce type de document.
  7. Si vous sélectionnez une région par erreur, utilisez l'outil Supprimer pour annuler la sélection.
  8. Sur toutes les pages suivantes, assurez-vous que les régions de champ sélectionnées contiennent les fragments de texte à extraire. Développez les régions de champ si nécessaire.
  9. Utilisez la commande Enregistrer le modèle de région de champ pour enregistrer votre modèle.

Application d'un modèle

  1. Dans la console d'administration à distance, ouvrez la boîte de dialogue Propriétés du workflow.
  2. Dans l'onglet Indexation, sélectionnez le type de document souhaité, puis cliquez sur Modifier. Dans la boîte de dialogue Type de document, cliquez sur Charger un modèle... et sélectionnez le fichier de modèle concerné. Dans la liste des champs d'index de ce type de document, une colonne spécifiant lequel des champs a été corrigé s'affiche.
  3. Commencez l'indexation de vos documents. Les valeurs des champs inclus dans le modèle seront automatiquement placées dans leurs champs d'index correspondants.

Remarque. Seules les valeurs des champs des premières pages seront extraites automatiquement.

Remarque. Les valeurs qui ne correspondent pas au type du champ d'index ne seront pas ajoutées.

Astuce. Si un lot contient des documents de plusieurs types différents, vous pouvez créer un modèle de région de champ pour chacun des types de document, puis passer d'un modèle à un autre dans le volet Type de document du poste d'indexation.

26.03.2024 13:49:50

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.