Wenn Ihr gedrucktes Dokument nicht dem Standard entsprechende Schriftarten enthält

Wenn Dokumente Zierschriften oder Sonderzeichen (z. B. mathematische Symbole) enthalten, erhöht der Testmodus die OCR-Qualität.

Hinweis: Es ist nicht ratsam, den Testmodus in anderen Fällen zu verwenden, da die Erkennungsqualität im Vergleich zum Aufwand für das Testen nur unwesentlich verbessert wird.

Im Testmodus wird ein Muster erstellt, das während des OCR-Vorgangs für den gesamten Text verwendet werden kann.

Verwenden von Benutzermustern

So verwenden Sie ein Muster bei der Dokumenterkennung:

  1. Öffnen Sie das Dialogfeld Optionen (Extras > Optionen…) und klicken Sie dann auf die Registerkarte Lesen.
  2. Wählen Sie unter Training die Option Nur Benutzermuster verwenden.

Hinweis: Wenn Sie die Option Integrierte und Benutzermuster verwenden wählen, werden von ABBYY FineReader 12 beim OCR sowohl Benutzermuster als auch ab Werk vordefinierte Muster verwendet.

  1. Klicken Sie auf die Schaltfläche Mustereditor….
  2. Wählen Sie im Dialogfeld Mustereditor das gewünschte Muster aus und klicken Sie anschließend auf OK.
  3. Klicken Sie im Hauptfenster von ABBYY FineReader auf die Schaltfläche Lesen.

Erstellen und Testen eines Benutzermusters

So testen Sie ein Benutzermuster für die Erkennung neuer Zeichen und Ligaturen:

  1. Öffnen Sie das Dialogfeld Optionen (Extras > Optionen…) und klicken Sie dann auf die Registerkarte Lesen.
  2. Wählen Sie unter Training Integrierte und Benutzermuster verwenden oder Nur Benutzermuster verwenden.
  3. Wählen Sie die Option Lesen mit Training.
  4. Klicken Sie auf die Schaltfläche Mustereditor….

Hinweis: Der Mustertest wird für asiatische Sprachen nicht unterstützt.

  1. Klicken Sie im Dialogfeld Mustereditor auf Neu…
  2. Das Dialogfeld Muster erstellen wird geöffnet. Geben Sie den Namen des Benutzermusters ein und klicken Sie auf OK.
  3. Schließen Sie die Dialogfelder Mustereditor und Optionen, indem Sie jeweils auf die Schaltfläche OK klicken.
  4. Klicken Sie in der Symbolleiste am oberen Rand des Bildfensters auf Lesen.

Trifft ABBYY FineReader jetzt auf ein unbekanntes Zeichen, wird dieses Zeichen im Dialogfeld Mustertraining angezeigt.

  1. Bringen Sie dem Programm das Lesen neuer Zeichen und Ligaturen bei.

Ligaturen sind Kombinationen aus zwei oder drei scheinbar "zusammengeklebten" Zeichen, (beispielsweise fi, fl, ffi etc.) und sind für das Programm schwer zu unterscheiden. Darum lassen sich bessere Ergebnisse erzielen, wenn diese Buchstabenkombinationen gleich als eigenständige Zusammensetzungen behandelt werden.

Hinweis: Fett oder kursiv gedruckte Wörter in Ihrem Text oder hochgestellte/tiefgestellte Wörter können im erkannten Text beibehalten werden, indem die entsprechenden Optionen unter Effekte ausgewählt werden.

Um zu einem zuvor getesteten Zeichen zurückzukehren, klicken Sie auf die Schaltfläche Zurück. Der Rahmen springt dann an die vorige Position, und die zuletzt getestete "Zeichenabbild-Tastaturzeichen"-Entsprechung wird aus dem Muster entfernt. Mit der Schaltfläche Zurück navigieren Sie zwischen den Zeichen eines Wortes und nicht zwischen ganzen Wörtern.

Wichtig!

  • Sie können ABBYY FineReader nur die Zeichen beibringen, die im Alphabet der Erkennungssprache enthalten sind. Wenn das Programm auch Zeichen lesen können soll, die nicht über die Tastatur eingegeben werden können, müssen Sie zur Kennzeichnung dieser inexistenten Zeichen zwei Zeichen verwenden oder das betreffende Zeichen aus dem Dialogfeld Zeichen einfügen (um das Dialogfeld aufzurufen, klicken Sie auf   ).
  • Ein Muster kann bis zu 1000 neue Zeichen enthalten.  Vermeiden Sie jedoch, zu viele Ligaturen zu erstellen, da dies die OCR-Qualität beeinträchtigen kann.

Auswählen eines Benutzermusters

In ABBYY FineReader können zur Verbesserung der OCR-Qualität Muster verwendet werden.

  1. Klicken Sie im Menü Extras auf Mustereditor….
  2. Wählen Sie im Dialogfeld Mustereditor das gewünschte Muster aus der Liste der verfügbaren Muster aus, und klicken Sie auf Aktivieren.

Wichtige Punkte, an die Sie denken sollten:

  1. Anstatt zwischen ähnlichen, aber dennoch unterschiedlichen Zeichen zu unterscheiden, erkennt ABBYY FineReader diese als ein und dasselbe Zeichen. Beispielsweise werden gerade ('), linke (‘) und rechte (’) Anführungszeichen in einem Muster als Einzelzeichen gespeichert (gerades Anführungszeichen). Das bedeutet, dass im erkannten Text – auch wenn Sie einen Test ausführen – grundsätzlich keine öffnenden und schließenden Anführungszeichen verwendet werden.
  2. Bei manchen Zeichen entscheidet ABBYY FineReader auf der Grundlage des umgebenden Kontexts, welches Tastaturzeichen dem Zeichen entspricht. Ein kleiner Kreis wird in einer Buchstabenumgebung beispielsweise als Buchstabe O und in Umgebung von Zahlen als Ziffer 0 erkannt.
  3. Muster können nur für Dokumente verwendet werden, die in Schriftart, Schriftgröße und Auflösung mit dem Dokument übereinstimmen, das zur Erstellung des Musters verwendet wurde.
  4. Damit ein Muster später verwendet werden kann, muss es als Datei gespeichert werden. Weitere Informationen finden Sie unter "Was ist ein FineReader-Dokument?".
  5. Um Texte in einer anderen Schriftart zu erkennen, muss das Benutzermuster deaktiviert sein. Dazu wählen Sie unter Extras > Optionen… die Option Nur integrierte Muster verwenden > Lesen.

Bearbeiten eines Benutzermusters

Oft müssen Sie das neu erstellte Muster bearbeiten, bevor Sie den OCR-Vorgang starten. Ein falsch getestetes Muster kann die OCR-Qualität beeinträchtigen. Das Muster sollte nur vollständige Zeichen oder Ligaturen enthalten. Zeichen mit abgeschnittenen Rändern oder falschen Buchstabenentsprechungen sollten aus dem Muster entfernt werden.

  1. Klicken Sie im Menü Extras auf Mustereditor….
  2. Das Dialogfeld Mustereditor wird geöffnet. Wählen Sie das gewünschte Muster und klicken Sie auf die Schaltfläche Bearbeiten….
  3. Wählen Sie im Dialogfeld Benutzermuster das gewünschte Zeichen aus und klicken Sie auf die Schaltfläche Eigenschaften….

Im sich öffnenden Dialogfeld:

  • Geben Sie den Buchstaben ein, der dem Zeichen im Feld Zeichen entspricht
  • Legen Sie im Feld Effekt den gewünschten Schriftarteneffekt fest (kursiv, fett, hochgestellt, tiefergestellt).

Klicken Sie im Dialogfeld Benutzermuster auf die Schaltfläche Löschen, um ein falsch getestetes Zeichen zu löschen.

14.01.2020 17:26:18


Please leave your feedback about this article