Vor dem OCR-Vorgang zu berücksichtigende Dokumenteigenschaften

Download

Die Qualität der Bilder hat einen wesentlichen Einfluss auf die Erkennungsqualität. In diesem Abschnitt wird erläutert, welche Faktoren vor der Erkennung von Bildern berücksichtigt werden sollten:

Dokumentsprachen

ABBYY FineReader erkennt sowohl ein- als auch mehrsprachige Dokumente (z. B. in zwei oder mehr Sprachen geschrieben). Bei mehrsprachigen Dokumenten müssen Sie mehrere Erkennungssprachen auswählen.

Um eine OCR-Sprache für Ihr Dokument festzulegen, wählen Sie in der Dropdownliste Dokumentsprache in der Hauptsymbolleiste oder im Fenster Task eine der folgenden Optionen:

  • Automatische Auswahl

ABBYY FineReader wählt automatisch die entsprechenden Sprachen aus der benutzerdefinierten Sprachenliste aus. Um diese Liste zu ändern:

  1. Wählen Sie Weitere Sprachen…
  2. Wählen Sie im Dialogfeld Spracheditor die Option Dokumentsprachen automatisch aus der folgenden Liste auswählen.
  3. Klicken Sie auf die Schaltfläche Auswählen….
  4. Wählen Sie im Dialogfeld Sprachen die gewünschten Sprachen aus.
  • Eine Sprache oder eine Kombination von Sprachen

Wählen Sie eine Sprache oder eine Sprachkombination aus. Die Sprachen in der Liste beinhalten die kürzlich verwendeten Erkennungssprachen sowie Englisch, Deutsch und Französisch.

  • Weitere Sprachen…

Wählen Sie diese Option, wenn die benötigte Sprache in der Liste nicht aufgeführt ist.

Wählen Sie im Dialogfeld Spracheditor die Option Sprachen einzeln auswählen und wählen Sie danach die gewünschte Sprache oder die gewünschten Sprachen, indem Sie die entsprechenden Kontrollkästchen aktivieren. Wenn Sie eine bestimmte Sprachkombination häufig verwenden, können Sie für die betreffenden Sprachen eine neue Gruppe erstellen.

Befindet sich eine Sprache nicht in der Liste:

  1. Wird diese Sprache von ABBYY FineReader nicht unterstützt.

Die vollständige Liste unterstützter Sprachen finden Sie unter "Unterstützte Sprachen."

  1. Diese Sprache wird von Ihrer Version der Software nicht unterstützt.

Die vollständige Liste der verfügbaren Sprachen in Ihrer Kopie finden Sie im Dialogfeld Lizenzen (Hilfe > Info… > Lizenzinformationen).

Neben den integrierten Sprachen und Sprachgruppen können Sie auch Ihre eigenen Sprachen erstellen. Weitere Informationen finden Sie unter "Wenn das Programm manche Zeichen nicht erkannt hat."

Drucktyp

Die Dokumente können auf verschiedenen Geräten, wie beispielsweise Schreibmaschinen und Faxgeräten, gedruckt worden sein. Durch die Auswahl des korrekten Dokumentdrucktyp im Dialogfeld Optionen kann die OCR-Qualität verbessert werden.

Bei den meisten Dokumenten erkennt das Programm den Drucktyp automatisch. Bei der automatischen Drucktyperkennung muss im Dialogfeld Optionen unter Dokumentdrucktyp die Option Automatisch ausgewählt sein (Extras > Optionen…). Sie können das Dokument im Vollfarb- oder im Schwarzweiß-Modus verarbeiten.

Bei Bedarf können Sie den Drucktyp jedoch auch manuell auswählen.

Ein Beispiel für einen Schreibmaschinentext. Alle Zeichen haben dieselbe Breite (vergleichen Sie z. B. "w" und "t"). Wählen Sie bei diesen Texten Schreibmaschine.
Ein Beispiel für einen von einem Faxgerät erstellten Text. Wie Sie am Beispiel sehen können, sind die Buchstaben an einigen Stellen unscharf, zusätzlich zu Rauschen und Verzerrungen. Wählen Sie bei diesen Texten Fax.

Tipp: Vergessen Sie nicht, nach der Erkennung von Faxen oder Schreibmaschinentexten vor der Verarbeitung normal gedruckter Dokumente wieder Automatische Erkennung auszuwählen.

Druckqualität

Dokumente in schlechter Qualität mit "Rauschen" (d. h. verstreuten schwarzen Punkten oder Flecken), unscharfen bzw. ungleichmäßigen Buchstaben oder schiefen Zeilen und verschobenen Tabellenbegrenzungen benötigen u. U. spezifische Scaneinstellungen.

Fax Zeitung

Dokumente in schlechter Qualität werden am besten in Graustufen gescannt. Dabei wählt das Programm automatisch den optimalen Wert der Helligkeit aus.

Der Graustufen-Scanmodus hält mehr Informationen über die Buchstaben im gescannten Text fest, wodurch beim Erkennen von Dokumenten mittlerer bis schlechter Qualität bessere OCR-Ergebnisse erhalten werden. Mit dem im Bildeditor verfügbaren Werkzeugen können Sie einige der Mängel auch manuell korrigieren. Weitere Informationen finden Sie unter "Bildvorverarbeitung."

Farbmodus

Müssen die Farben in einem Vollfarbdokument nicht erhalten bleiben, können Sie das Dokument im Schwarzweiß-Modus verarbeiten. Dadurch wird die Größe des resultierenden ABBYY FineReader-Dokuments reduziert und der OCR-Vorgang beschleunigt. Werden jedoch Bilder mit niedrigem Kontrast im Schwarzweiß-Modus verarbeitet, ist die resultierende OCR-Qualität möglicherweise schlecht. Darüber hinaus empfehlen wir die Schwarzweiß-Verarbeitung nicht für Fotos, Zeitschriftenseiten und Texte auf Chinesisch, Japanisch und Koreanisch.

Hinweis: Sie können außerdem die Erkennung von Farb- und Schwarzweiß-Dokumenten beschleunigen, indem Sie die Option Schnell auf der Registerkarte Lesen im Dialogfeld Optionen auswählen. Weitere Informationen über die Erkennungsmodi finden Sie unter OCR-Optionen.

So wird ein Farbmodus ausgewählt:

  • Verwenden Sie die Dropdownliste Farbmodus im Dialogfeld Task oder
  • Wählen Sie im Dialogfeld Optionen auf der Registerkarte Dokument eine der Optionen unter Farbmodus (Extras > Optionen…).

Wichtig! Nachdem das Dokument zu Schwarzweiß konvertiert wurde, können die Farben nicht wiederhergestellt werden. Um ein Farbdokument zu erhalten, öffnen Sie die Datei mit Farbbildern oder scannen das Papierdokument im Farbmodus.

14.01.2020 17:26:18

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.