- English (English)
- Bulgarian (Български)
- Chinese Simplified (简体中文)
- Chinese Traditional (繁體中文)
- Czech (Čeština)
- Danish (Dansk)
- Dutch (Nederlands)
- French (Français)
- Greek (Ελληνικά)
- Hungarian (Magyar)
- Italian (Italiano)
- Japanese (日本語)
- Korean (한국어)
- Polish (Polski)
- Portuguese (Brazilian) (Português (Brasil))
- Slovak (Slovenský)
- Spanish (Español)
- Swedish (Svenska)
- Turkish (Türkçe)
- Ukrainian (Українська)
- Vietnamese (Tiếng Việt)
OCR-Optionen
Für schnelle und fehlerfreie Ergebnisse ist die Auswahl der richtigen OCR-Optionen von entscheidender Bedeutung. Bei Ihrer Entscheidung, welche Optionen Sie nutzen, müssen Sie nicht nur Typ und Komplexität Ihres Dokuments berücksichtigen, sondern auch, wie die Ergebnisse verwendet werden sollen. Folgende Optionsgruppen sind verfügbar:
- PDF-Erkennungsmodi
- Mittelweg zwischen Geschwindigkeit und Genauigkeit der Erkennung
- Dokumententyp
- Erkennung struktureller Elemente
- Strichcodes
- Muster und Sprachen
- Die im erkannten Text zu verwendenden Schriftarten
Die OCR-Optionen finden Sie auf der Registerkarte OCR des Dialogfelds Optionen (klicken Sie auf Werkzeuge > Optionen..., um dieses Dialogfeld zu öffnen).
ABBYY FineReader erkennt automatisch alle Seiten, die Sie einem OCR-Projekt hinzufügen. Die aktuell ausgewählten Optionen werden für den OCR-Vorgang verwendet. Sie können die automatische Analyse und Erkennung neu hinzugefügter Bilder in der Registerkarte Bildverarbeitung des Dialogfelds Optionen deaktivieren (klicken Sie auf Werkzeuge > Optionen..., um dieses Dialogfeld zu öffnen).
Wenn Sie die OCR-Optionen ändern, nachdem ein Dokument erkannt wurde, führen Sie den OCR-Prozess erneut durch, um die neuen Optionen auf die Dokumenterkennung anzuwenden.
Diese Einstellungen sind für PDF-Dokumente vorgesehen, die Textebenen und Bilder enthalten. Solche PDF-Dokumente werden im Allgemeinen aus Dokumenten in bearbeitbaren Formaten erstellt. Andere Typen von PDF-Dokumenten, wie z. B. durchsuchbare PDFs und Nur-Bild-PDFs, werden immer im Modus OCR verwenden verarbeitet, was der Standardmodus für diese PDF-Typen ist. Für die Verarbeitung solcher PDFs sind keine zusätzlichen Einstellungen erforderlich.
Es sind drei Erkennungsmodi verfügbar:
- Automatisch zwischen OCR und Text von PDF auswählen
Das Programm überprüft die Textebene und verwendet die vorhandene Textebene, falls sie Text in guter Qualität enthält. Andernfalls wird mithilfe der OCR eine neue Textebene erstellt. - OCR verwenden
OCR wird für die Erstellung einer neuen Textebene verwendet. Dieser Modus erfordert mehr Zeit, aber ist für Dokumente mit Textebenen von schlechter Qualität besser geeignet. - Nur Text von PDF verwenden
Das ist der Standardmodus für PDF-Dokumente mit Textebenen. Das Programm verwendet die Original-Textebene und führt keinen OCR-Vorgang aus.
Mittelweg zwischen Geschwindigkeit und Genauigkeit der Erkennung
ABBYY FineReader PDF 15 ermöglicht Ihnen die Ausführung von:
- Gründliche Erkennung
In diesem Modus analysiert und erkennt ABBYY FineReader sowohl einfache Dokumente als auch Dokumente mit komplexem Layout, sogar mit Text vor farbigem Hintergrund sowie Dokumente, die komplexe Tabellen enthalten (z. B. Tabellen mit weißen Gitterlinien oder farbigen Zellen).
Gründliche Erkennung benötigt mehr Zeit, liefert aber eine bessere Qualität. - Schnelle Erkennung
Dieser Modus wird empfohlen, wenn Sie umfangreiche Dokumente mit einfachem Layout und guter Bildqualität verarbeiten möchten.
Gibt den Gerätetyp an, der für den Druck des Dokuments verwendet wurde. Siehe auch: Vor dem Erkennungsvorgang zu berücksichtigende Dokumenteigenschaften.
Strukturelle Elemente erkennen
Wählen Sie die strukturellen Elemente, die das Programm erkennen soll: Kopf- und Fußzeilen, Fußnoten, Inhaltsverzeichnisse und Listen. Die ausgewählten Elemente werden nach dem Speichern des Dokuments anklickbar.
Enthält Ihr Dokument Strichcodes, die Sie in Zeichenfolgen aus Buchstaben und Ziffern konvertieren möchten, statt sie als Bilder zu speichern, wählen Sie Strichcodes zu Zeichenfolgen konvertieren. Diese Funktion ist standardmäßig deaktiviert.
Die Erkennung mit Training wird bei den folgenden Texttypen verwendet:
- Texte mit Sonderzeichen (z. B. mathematische Symbole)
- Text mit Zierelementen
- Große Textvolumen von Bildern schlechter Qualität (über 100 Seiten)
Training ist standardmäßig deaktiviert. Aktivieren Sie Verwenden Sie das Training zum Erkennen neuer Zeichen und Ligaturen, um ABBYY FineReader bei der Durchführung von OCR zu trainieren.
Sie können für das Training integrierte oder Ihre eigenen benutzerdefinierten Erkennungsmuster verwenden.
Die Einstellungen für Benutzermuster und Sprachen können gespeichert und wieder geladen werden. Siehe auch: OCR-Projekt.
Hier können Sie die Schriftarten auswählen, die beim Speichern von erkanntem Text verwendet werden sollen.
So wählen Sie die Schriftarten aus:
- Klicken Sie auf die Schaltfläche Schriftarten auswählen....
- Wählen Sie die gewünschten Schriftarten aus und klicken Sie auf OK.
04.03.2022 7:13:05