Wenn das Programm bestimmte Zeichen nicht erkannt hat

ABBYY FineReader 14 verwendet bei der Erkennung Daten über die Dokumentsprache. Gelegentlich kann es vorkommen, dass das Programm manche Zeichen in Dokumenten mit ungewöhnlichen Elementen (z. B. Codenummern) nicht erkennt, da diese Zeichen unter Umständen nicht in der Dokumentsprache enthalten sind. Damit solche Dokumente erkannt werden können, kann eine benutzerdefinierte Sprache mit den benötigten Zeichen erstellt werden. Sie können außerdem Gruppen der verschiedenen OCR-Sprachen erstellen und diese Gruppen beim Erkennen von Dokumenten verwenden.

So wird eine Benutzersprache erstellt

  1. Öffnen Sie das Dialogfeld Optionen (klicken Sie auf Werkzeuge > Optionen... um dieses Dialogfeld zu öffnen), klicken Sie auf die Registerkarte Sprachen.
  2. Klicken Sie auf die Schaltfläche Neu....
  3. Wählen Sie im sich öffnenden Dialogfeld die Option Eine neue Sprache anhand einer bestehenden erstellen und die Sprache, die als Grundlage für die neue Sprache verwendet werden soll und klicken Sie auf OK.
  4. Das Dialogfeld Spracheigenschaften wird geöffnet. In diesem Dialogfeld:
    1. Geben Sie einen Namen für Ihre neue Sprache ein.
    2. Die von Ihnen im Dialogfeld Neue Sprache oder Gruppe ausgewählte Sprache wird in der Dropdownliste Quellsprache angezeigt. In dieser Dropdownliste kann eine andere Sprache ausgewählt werden.
    3. Das Dialogfeld Alphabet enthält das Alphabet der Ausgangssprache. Wenn Sie das Alphabet bearbeiten möchten, klicken Sie auf die Schaltfläche .
    4. Im Wörterbuch stehen verschiedene Optionen für das Wörterbuch zur Verfügung, die vom Programm bei der Texterkennung und Ergebnisüberprüfung verwendet werden:
      • Kein
        Die Sprache enthält kein Wörterbuch.
      • Integriertes Wörterbuch
        Es wird das in das Programm integrierte Wörterbuch verwendet.
      • Benutzerwörterbuch
        Klicken Sie auf die Schaltfläche Bearbeiten..., um Wörterbuchbegriffe festzulegen oder um ein vorhandenes Benutzerwörterbuch oder eine Textdatei mit Windows-1252-Kodierung zu importieren (Begriffe müssen durch Leerzeichen oder andere Zeichen, die nicht im Alphabet enthalten sind, getrennt sein).
        Wörter aus dem Benutzerwörterbuch werden bei der Überprüfung des erkannten Textes nicht als falsch geschrieben markiert. Sie können komplett klein-, aber auch komplett groß geschrieben sein oder mit einem Großbuchstaben beginnen.
Wort im Wörterbuch Wörter, die bei einer Rechtschreibprüfung nicht als falsch geschrieben angesehen werden
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
Abc aBc, abc, Abc, ABC
  • Das Dialogfeld Regulärer Ausdruck ermöglicht Ihnen das Erstellen eines Benutzerwörterbuchs unter Verwendung regulärer Ausdrücke.
    Siehe auch: Reguläre Ausdrücke.
  1. Sprachen können mehrere zusätzliche Eigenschaften aufweisen. Um diese Eigenschaften zu ändern, klicken Sie auf die Schaltfläche Erweitert..., um das Dialogfeld Erweiterte Spracheigenschaften zu öffnen, wo Folgendes festgelegt werden kann:
    • Zeichen, die am Anfang oder am Ende eines Wortes stehen können
    • Zeichen, die keine Buchstaben sind und getrennt von Wörtern angezeigt werden
    • Zeichen, die innerhalb von Wörtern erscheinen, aber ignoriert werden sollten
    • Zeichen, die nicht in einem Text erscheinen dürfen, die mithilfe dieser Sprache erkannt werden (verbotene Zeichen)
    • Die Text kann arabische Ziffern, römische Ziffern und Abkürzungen enthalten Option
  2. Bei der Auswahl der OCR-Sprachen kann jetzt die neu erstellte Sprache ausgewählt werden.
    Weitere Informationen zu OCR-Sprachen finden Sie unter OCR-Sprachen.

Standardmäßig wird die Benutzersprache im Ordner des OCR-Projekts gespeichert. Sie können außerdem alle Benutzermuster und Sprachen in einer Datei speichern. Dazu öffnenSie das Dialogfeld Optionen (klicken Sie aufWerkzeuge > Optionen... um dieses Dialogfeld zu öffnen). Klicken Sie auf die Registerkarte OCR und klicken Sie dann auf die Schaltfläche Muster und Sprachen speichern....

Erstellen einer Sprachgruppe

Verwenden Sie eine bestimmte Sprachkombination regelmäßig, können die Sprachgruppen zur Vereinfachung gruppiert werden.

  1. Öffnen Sie das Dialogfeld Optionen (klicken Sie auf Werkzeuge > Optionen... um dieses Dialogfeld zu öffnen) und klicken Sie auf die Registerkarte Sprachen.
  2. Klicken Sie auf die Schaltfläche Neu....
  3. Wählen Sie im Dialogfeld Neue Sprache oder Gruppe die Option Eine neue Gruppe von Sprachen erstellen und klicken Sie auf OK.
  4. Das Dialogfeld Sprachgruppeneigenschaften wird geöffnet. Geben Sie in diesem Dialogfeld den Namen für die Sprachgruppe ein und wählen Sie die Sprachen aus, die in der Gruppe enthalten sein sollen.
    Wenn Sie bereits wissen, dass bestimmte Zeichen nicht im Text vorkommen, können Sie diese sogenannten "unzulässigen Zeichen" gleich angeben. So können die Geschwindigkeit und Genauigkeit des OCR-Vorgangs erhöht werden. Um diese Zeichen anzugeben, klicken Sie auf die Schaltfläche Erweitert... im Dialogfeld Sprachgruppeneigenschaften und geben die unzulässigen Zeichen in das Feld Unzulässige Zeichen ein.
  5. Klicken Sie auf OK.

Die neue Gruppe wird jetzt in der Dropdownliste der Sprachen in der Hauptsymbolleiste angezeigt.

Standardmäßig werden alle benutzerdefinierten Sprachgruppen im Ordner des OCR-Projekts gespeichert. Sie können außerdem alle Benutzermuster und Sprachen in einer Datei speichern. Dazu öffnenSie das Dialogfeld Optionen (klicken Sie auf Werkzeuge > Optionen... um dieses Dialogfeld zu öffnen). Klicken Sie auf die Registerkarte OCR und klicken Sie dann auf die Schaltfläche Muster und Sprachen speichern....

Tipp. Eine Sprachgruppe kann mithilfe der Dropdownliste mit den Sprachen in der Hauptsymbolleiste ausgewählt werden.

  1. Wählen Sie Weitere Sprachen... in der Dropdownliste mit den Sprachen in der Hauptsymbolleiste.
  2. Wählen Sie im Dialogfeld Spracheditor die Option OCR-Sprachen manuell festlegen.
  3. Wählen Sie die gewünschten Sprachen aus und klicken Sie auf OK.

11/2/2018 4:19:16 PM


Please leave your feedback about this article