Erstellen einer Benutzersprache

Korrekturstation verwendet bei der Erkennung Daten über die Dokumentsprache. Gelegentlich kann es vorkommen, dass das Programm manche Zeichen in Dokumenten mit ungewöhnlichen Elementen (z. B. Codenummern) nicht erkennt, da diese Zeichen unter Umständen nicht in der Dokumentsprache enthalten sind. Damit solche Dokumente erkannt werden können, kann eine benutzerdefinierte Sprache mit den benötigten Zeichen erstellt werden. Sie können außerdem Gruppen der verschiedenen OCR-Sprachen erstellen und diese Gruppen beim Erkennen von Dokumenten verwenden.

  1. Im Menü Extras wählen Sie Spracheditor....
  2. Im Dialogfeld Spracheditor Klicken Sie auf die Schaltfläche Neu....
  3. Wählen Sie im sich öffnenden Dialogfeld die Option Eine neue Sprache anhand einer bestehenden erstellen und die Sprache, die als Grundlage für die neue Sprache verwendet werden soll und klicken Sie auf OK.
  4. Das Dialogfeld Spracheigenschaften wird geöffnet. In diesem Dialogfeld:
    1. Geben Sie einen Namen für Ihre neue Sprache ein.
    2. Die von Ihnen im Dialogfeld Neue Sprache oder Gruppe ausgewählte Sprache wird in der Dropdownliste Quellsprache angezeigt. In dieser Dropdownliste kann eine andere Sprache ausgewählt werden.
    3. Das Dialogfeld Alphabet enthält das Alphabet der Ausgangssprache. Wenn Sie das Alphabet bearbeiten möchten, klicken Sie auf die Schaltfläche .
    4. Im Wörterbuch stehen verschiedene Optionen für das Wörterbuch zur Verfügung, die vom Programm bei der Texterkennung und Ergebnisüberprüfung verwendet werden:
      • Kein
        Die Sprache enthält kein Wörterbuch.
      • Integriertes Wörterbuch
        Es wird das in das Programm integrierte Wörterbuch verwendet.
      • Benutzerwörterbuch
        Klicken Sie auf die Schaltfläche Bearbeiten..., um Wörterbuchbegriffe festzulegen oder um ein vorhandenes Benutzerwörterbuch oder eine Textdatei mit Windows-1252-Kodierung zu importieren (Begriffe müssen durch Leerzeichen oder andere Zeichen, die nicht im Alphabet enthalten sind, getrennt sein).
        Wörter aus dem Benutzerwörterbuch werden bei der Überprüfung des erkannten Textes nicht als falsch geschrieben markiert. Sie können komplett klein-, aber auch komplett groß geschrieben sein oder mit einem Großbuchstaben beginnen.
Wort im Wörterbuch Wörter, die bei einer Rechtschreibprüfung nicht als falsch geschrieben angesehen werden
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
Abc aBc, abc, Abc, ABC
  • Das Dialogfeld Regulärer Ausdruck ermöglicht Ihnen das Erstellen eines Benutzerwörterbuchs unter Verwendung regulärer Ausdrücke.
    Siehe auch: Reguläre Ausdrücke.
  1. Sprachen können mehrere zusätzliche Eigenschaften aufweisen. Um diese Eigenschaften zu ändern, klicken Sie auf die Schaltfläche Erweitert..., um das Dialogfeld Erweiterte Spracheigenschaften zu öffnen, wo Folgendes festgelegt werden kann:
    • Zeichen, die am Anfang oder am Ende eines Wortes stehen können
    • Zeichen, die keine Buchstaben sind und getrennt von Wörtern angezeigt werden
    • Zeichen, die innerhalb von Wörtern erscheinen, aber ignoriert werden sollten
    • Zeichen, die nicht in einem Text erscheinen dürfen, die mithilfe dieser Sprache erkannt werden (verbotene Zeichen)
    • Die Text kann arabische Ziffern, römische Ziffern und Abkürzungen enthalten Option
  1. Bei der Auswahl der OCR-Sprachen kann jetzt die neu erstellte Sprache ausgewählt werden.

Standardmäßig wird die Benutzersprache im Ordner des OCR-Projekts gespeichert. Sie können außerdem alle Benutzermuster und Sprachen in einer Datei speichern. Dazu öffnenSie das Dialogfeld Optionen (klicken Sie aufWerkzeuge > Optionen... um dieses Dialogfeld zu öffnen). Klicken Sie auf die Registerkarte OCR und klicken Sie dann auf die Schaltfläche Muster und Sprachen speichern....

Siehe auch:

Dokumentsprachen

26.03.2024 13:49:48

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.