Mustertraining

Enthält Ihr zu erkennendes Dokument Zierschriften oder Sonderzeichen (z. B. mathematische Symbole), die dem Programm unbekannt sind, empfehlen wir zur Verbesserung der OCR-Genauigkeit die Verwendung von Mustertraining Muster werden durch das Zuordnen von Bildern von Zeichen im Text zu ihren jeweiligen Tastaturgegenstücken. Dies geschieht durch das einfache Drücken der Nach-rechts-Taste auf der Tastatur, sobald das Programm ein Zeichenbild angibt, das es nicht erkennen kann. Es kann vorkommen, dass Sie dasselbe Zeichen mehrmals bestätigt müssen, da der Computer feinere Unregelmäßigkeiten zwischen den Zeichenbildern erkennt, die für das bloße Auge nicht wahrnehmbar sind. Dies wird Mustertraining genannt und untermauert wirksam den Bezug zwischen den Gruppen von Zeichenbildern und deren Tastaturgegenstücken.

Es ist nicht ratsam, den Trainingsmodus in anderen Fällen zu verwenden, da die OCR-Qualität im Vergleich zum Aufwand für das Training nur unwesentlich verbessert wird.

Das Mustertraining wird für asiatische Sprachen nicht unterstützt.

Im Trainingsmodus wird ein Muster erstellt, das während des OCR-Vorgangs für den gesamten Text verwendet werden kann.

Sie möchten vielleicht Ihr neu erstelltes Muster vor dem Start des OCR-Vorgangs noch einmal bearbeiten. Ein falsch trainiertes Muster kann die OCR-Qualität beeinträchtigen. Das Muster sollte nur vollständige Zeichen oder Ligaturen enthalten. Zeichen mit abgeschnittenen Kanten und Zeichen mit falschen Buchstabenpaarungen sollten aus dem Muster entfernt werden.

Erstellen und Bearbeiten von Mustern

Trainingsmuster

Wichtige Dinge, die Sie über das Mustertraining wissen sollten

  • Die OCR-Engine macht keinen Unterschied zwischen bestimmten Zeichenbildern und ordnet sie ein und demselben Tastaturzeichen zu. Beispiel: gerade Apostrophe ('), linke einfache Anführungszeichen (‘) und rechte einfache Anführungszeichen (’) werden alle dem Tastaturzeichen gerades Apostroph zugeordnet. Das bedeutet, linke und rechte Anführungszeichen werden in erkannten Texten in keinem Fall reproduziert, selbst wenn Sie die jeweiligen Tastaturzeichen im Modus Mustertraining eingeben.
  • Bei bestimmten Zeichenbildern wählt die OCR-Engine die Tastaturgegenstücke auf der Basis des größeren Kontexts aus. Beispiel: Das Bild eines Kreises könnte entweder eine Null oder der Buchstabe O sein und die OCR-Engine wählt zwischen den zwei Alternativen, indem die benachbarten Zeichen berücksichtigt werden. Ist der Kreis von Ziffern umgeben, entscheidet das Programm zugunsten der Null, ansonsten wird der Kreis als der Buchstabe O interpretiert.
  • Ein trainiertes Muster kann nur für das Erkennen von Text verwendet werden, der mit der gleichen Schriftart und Schriftgröße gedruckt und mit der gleichen Auflösung wie das Bild gescannt wurde, mit dem das Muster trainiert wurde.
Siehe auch:

Dokumentsprachen angeben

26.03.2024 13:49:48

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.