OCR-Optionen

Für schnelle und fehlerfreie Ergebnisse ist die Auswahl der richtigen OCR-Optionen von entscheidender Bedeutung. Bei Ihrer Entscheidung, welche Optionen Sie nutzen, müssen Sie nicht nur Typ und Komplexität Ihres Dokuments berücksichtigen, sondern auch, wie die Ergebnisse verwendet werden sollen. Folgende Optionsgruppen sind verfügbar:

Die OCR-Optionen finden Sie auf der Registerkarte OCR des Dialogfelds Optionen (klicken Sie auf Werkzeuge > Optionen..., um dieses Dialogfeld zu öffnen).

ABBYY FineReader erkennt automatisch alle Seiten, die Sie einem OCR-Projekt hinzufügen. Die aktuell ausgewählten Optionen werden für den OCR-Vorgang verwendet. Sie können die automatische Analyse und Erkennung neu hinzugefügter Bilder in der Registerkarte Bildverarbeitung des Dialogfelds Optionen deaktivieren (klicken Sie auf Werkzeuge > Optionen..., um dieses Dialogfeld zu öffnen).

Wenn Sie die OCR-Optionen ändern, nachdem ein Dokument erkannt wurde, führen Sie den OCR-Prozess erneut durch, um die neuen Optionen auf die Dokumenterkennung anzuwenden.

PDF-Erkennungsmodi

Diese Einstellungen sind für PDF-Dokumente vorgesehen, die Textebenen und Bilder enthalten. Solche PDF-Dokumente werden im Allgemeinen aus Dokumenten in bearbeitbaren Formaten erstellt. Andere Typen von PDF-Dokumenten, wie z. B. durchsuchbare PDFs und Nur-Bild-PDFs, werden immer im Modus OCR verwenden verarbeitet, was der Standardmodus für diese PDF-Typen ist. Für die Verarbeitung solcher PDFs sind keine zusätzlichen Einstellungen erforderlich.

Es sind drei Erkennungsmodi verfügbar:

    • Automatisch zwischen OCR und Text von PDF auswählen
      Das Programm überprüft die Textebene und verwendet die vorhandene Textebene, falls sie Text in guter Qualität enthält. Andernfalls wird mithilfe der OCR eine neue Textebene erstellt.
    • OCR verwenden
      OCR wird für die Erstellung einer neuen Textebene verwendet. Dieser Modus erfordert mehr Zeit, aber ist für Dokumente mit Textebenen von schlechter Qualität besser geeignet.
    • Nur Text von PDF verwenden
      Das ist der Standardmodus für PDF-Dokumente mit Textebenen. Das Programm verwendet die Original-Textebene und führt keinen OCR-Vorgang aus.

Mittelweg zwischen Geschwindigkeit und Genauigkeit der Erkennung

ABBYY FineReader 14 ermöglicht Ihnen die Ausführung von:

  • Gründliche Erkennung
    In diesem Modus analysiert und erkennt ABBYY FineReader sowohl einfache Dokumente als auch Dokumente mit komplexem Layout, sogar mit Text vor farbigem Hintergrund sowie Dokumente, die komplexe Tabellen enthalten (z. B. Tabellen mit weißen Gitterlinien oder farbigen Zellen).
    Gründliche Erkennung benötigt mehr Zeit, liefert aber eine bessere Qualität.
  • Schnelle Erkennung
    Dieser Modus wird empfohlen, wenn Sie umfangreiche Dokumente mit einfachem Layout und guter Bildqualität verarbeiten möchten.

Drucktyp

Gibt den Gerätetyp an, der für den Druck des Dokuments verwendet wurde. Siehe auch: Vor dem Erkennungsvorgang zu berücksichtigende Dokumenteigenschaften.

Strukturelle Elemente erkennen

Wählen Sie die strukturellen Elemente, die das Programm erkennen soll: Kopf- und Fußzeilen, Fußnoten, Inhaltsverzeichnisse und Listen. Die ausgewählten Elemente werden nach dem Speichern des Dokuments anklickbar.

Strichcodes

Enthält Ihr Dokument Strichcodes, die Sie in Zeichenfolgen aus Buchstaben und Ziffern konvertieren möchten, statt sie als Bilder zu speichern, wählen Sie Strichcodes zu Zeichenfolgen konvertieren. Diese Funktion ist standardmäßig deaktiviert.

Muster und Sprachen

Die Erkennung mit Training wird bei den folgenden Texttypen verwendet:

  • Texte mit Sonderzeichen (z. B. mathematische Symbole)
  • Text mit Zierelementen
  • Große Textvolumen von Bildern schlechter Qualität (über 100 Seiten)

Training ist standardmäßig deaktiviert. Aktivieren Sie Verwenden Sie das Training zum Erkennen neuer Zeichen und Ligaturen, um ABBYY FineReader bei der Durchführung von OCR zu trainieren.

Sie können für das Training integrierte oder Ihre eigenen benutzerdefinierten Erkennungsmuster verwenden.

Die Einstellungen für Benutzermuster und Sprachen können gespeichert und wieder geladen werden. Siehe auch: OCR-Projekt.

Schriftarten

Hier können Sie die Schriftarten auswählen, die beim Speichern von erkanntem Text verwendet werden sollen.

So wählen Sie die Schriftarten aus:

  1. Klicken Sie auf die Schaltfläche Schriftarten auswählen....
  2. Wählen Sie die gewünschten Schriftarten aus und klicken Sie auf OK.

02.11.2018 16:19:16


Please leave your feedback about this article