Options d'OCR

Il est important de sélectionner les bonnes options d'OCR si vous voulez obtenir des résultats précis et rapides. Lorsque vous choisissez les options que vous voulez utiliser, prenez non seulement en considération le type et la complexité de votre document, mais aussi la manière dont vous avez prévu d'utiliser les résultats. Vous avez le choix entre les groupes d'options suivants :

Vous trouverez les options d'OCR dans OCR l'onglet de la Options la boîte de dialogue (cliquez sur Outils > Options... pour ouvrir cette boîte de dialogue).

ABBYY FineReader reconnaît automatique toutes les pages que vous ajoutez à un projet d'OCR. Les options actuellement sélectionnées seront utilisées pour l'OCR. Vous pouvez désactiver l'analyse et l'OCR automatiques des nouvelles images ajoutées dans Traitement des images l'onglet de la Options la boîte de dialogue (cliquez sur Outils > Options... pour ouvrir cette boîte de dialogue).

Si vous changez les options d'OCR après la reconnaissance d'un document, relancez le processus d'OCR pour reconnaître le document avec les nouvelles options.

Modes de reconnaissance PDF

Ces paramètres sont destinés à des documents PDF avec des calques de texte et des images. Ces documents PDF sont généralement créés à partir de documents aux formats modifiables. Les autres types de documents PDF tels que les PDF interrogeables et les PDF contenant uniquement des images sont toujours traités dans le mode Utiliser l'OCR, qui est le mode par défaut pour ces types de PDF. Aucun paramètre supplémentaire n'est nécessaire au traitement de ces PDF.

Trois modes de reconnaissance sont disponibles :

    • Choisir automatiquement entre OCR et texte à partir du PDF
      Le programme examinera la couche de texte et utilisera la couche de texte existante si elle contient un texte de bonne qualité. Dans le cas contraire, l'OCR sera utilisé pour créer une nouvelle couche de texte.
    • Utiliser l'OCR
      L'OCR sera utilisé pour créer une nouvelle couche de texte. Ce mode prend plus de temps mais il est adapté aux documents dont les couches de texte sont de faible qualité.
    • Utiliser uniquement le texte du PDF
      Il s'agit du mode par défaut pour les documents PDF avec couche de texte. Ce programme utilisera la couche de texte d'origine sans exécuter l'OCR.

Équilibre entre la vitesse et la précision d'OCR

ABBYY FineReader 14 vous permet de réaliser :

  • Reconnaissance rigoureuse
    Dans ce mode, ABBYY FineReader analyse et reconnaît les documents simples ainsi que les documents avec une mise en page complexe, même ceux dont le texte est imprimé sur un arrière-plan coloré et les documents avec des tableaux complexes (y compris les tableaux avec des lignes blanches et les tableaux dont les cellules sont colorées).
    Reconnaissance rigoureuse nécessite plus de temps mais offre une meilleure qualité.
  • Reconnaissance précise
    Ce mode est recommandé pour le traitement de documents lourds avec des mises en page simples et des images de bonne qualité.

Type d'impression

Spécifie le type de périphérique utilisé pour l'impression du document. Consultez également : Caractéristiques du document à prendre en compte avant l'OCR.

Détecte les éléments structurels

Sélectionnez les éléments structurels que le programme va détecter : en-têtes et pieds de page, notes en bas de page, tables des matières et listes. Vous pourrez cliquer sur les éléments sélectionnés lorsque le document sera enregistré.

Codes-barres

Si votre document contient des codes-barres et que vous souhaitez les convertir en chaînes de lettres et de numéros plutôt que les enregistrer en tant qu'images, sélectionnez Convertir les codes-barres en chaînes. Par défaut, cette fonctionnalité est désactivée.

Gabarits et langues

La reconnaissance avec apprentissage est utilisée pour reconnaître les types de texte suivants :

  • Textes avec les symboles spéciaux (par exemple, les symboles mathématiques)
  • Texte à éléments décoratifs
  • Volume important de textes provenant d'images de faible qualité (plus de 100 pages)

Apprentissage est désactivé par défaut. Activer Utiliser l'apprentissage pour reconnaître les nouveaux caractères et les ligatures pour apprendre ABBYY FineReader pendant l'OCR.

Vous pouvez utiliser les gabarits intégrés ou vos propres gabarits pour la reconnaissance.

Vous pouvez enregistrer et charger les paramètres pour les gabarits et langues utilisateur. Consultez également : Projet d'OCR.

Polices

Ici, vous pouvez sélectionner les polices à utiliser lorsque vous enregistrez le texte reconnu.

Pour sélectionner des polices :

  1. Cliquez sur le Sélectionner les polices... bouton.
  2. Sélectionnez les polices souhaitées et cliquez sur OK.

02.11.2018 16:19:22


Please leave your feedback about this article