Wenn das Programm manche Zeichen nicht erkannt hat

Download

ABBYY FineReader verwendet bei der Erkennung von Text Daten über die Dokumentsprache. Gelegentlich kann es vorkommen, dass das Programm manche Zeichen in Dokumenten mit ungewöhnlichen Elementen (z. B. Codenummern) nicht erkennt, da diese Zeichen unter Umständen nicht in der Dokumentsprache enthalten sind. Damit solche Dokumente erkannt werden können, kann eine benutzerdefinierte Sprache mit den benötigten Zeichen erstellt werden. Sie können außerdem den Sprachgruppen mehrere Sprachen zuweisen und diese Gruppen für die Erkennung verwenden.

Erstellen einer benutzerdefinierten Sprache

  1. Klicken Sie im Menü Extras auf Spracheditor…
  2. Klicken Sie im Dialogfeld Spracheditor auf Neu…
  3. Im sich öffnenden Dialogfeld wählen Sie die Option Eine neue Sprache anhand einer bestehenden erstellen und wählen Sie dann die Sprache aus, die als Basis für die neue Sprache verwendet werden soll, und klicken Sie auf OK.
  4. Das Dialogfeld Spracheigenschaften wird geöffnet. In diesem Dialogfeld:
    1. Geben Sie den Namen der neuen Sprache ein.
    2. Die zuvor von Ihnen ausgewählte Ausgangssprache wird in der Dropdownliste Quellsprache angezeigt. Sie können die Quellsprache ändern.
    3. Das Alphabet enthält das Alphabet der Ausgangssprache. Klicken Sie auf die Schaltfläche , wenn Sie das Alphabet bearbeiten möchten.
    4. In Bezug auf das Wörterbuch stehen verschiedene Optionen zur Verfügung, die vom Programm bei der Texterkennung und Ergebnisüberprüfung verwendet werden:
      • Keine

Die Sprache enthält kein Wörterbuch.

  • Integriertes Wörterbuch

Es wird das im Lieferumfang des Programms enthaltene Wörterbuch verwendet.

  • Benutzerwörterbuch

Klicken Sie auf die Schaltfläche Bearbeiten…, um Wörterbuchbegriffe festzulegen oder um ein vorhandenes Benutzerwörterbuch oder eine Textdatei mit Windows-1252-Kodierung zu importieren (Begriffe müssen durch Leerzeichen oder andere Zeichen, die nicht im Alphabet enthalten sind, getrennt sein).

Hinweis: Wörter aus dem Benutzerwörterbuch werden bei der Überprüfung des erkannten Textes nicht als falsch markiert. Sie können komplett klein-, aber auch komplett groß geschrieben sein oder mit einem Großbuchstaben beginnen.

Wort im Wörterbuch Wörter, die bei einer Rechtschreibprüfung nicht als falsch angesehen werden
abc abc, Abc, ABC
Abc abc, Abc, ABC
ABC abc, Abc, ABC
aBc aBc, abc, Abc, ABC
  • Regulärer Ausdruck

Sie können ein Wörterbuch für die benutzerdefinierte Sprache unter Verwendung regulärer Ausdrücke erstellen.

Weitere Informationen hierzu finden Sie unter "Reguläre Ausdrücke."

  1. Sprachen können mehrere zusätzliche Eigenschaften aufweisen. Um diese Eigenschaften zu ändern, klicken Sie auf die Schaltfläche Erweitert….

Das Dialogfeld Erweiterte Spracheigenschaften wird geöffnet. Hier können Sie Folgendes festlegen:

  • Zeichen, die sich am Anfang oder am Ende eines Wortes befinden können
  • Zeichen, die keine Buchstaben sind und getrennt von Wörtern angezeigt werden
  • Zeichen, die eventuell in der Mitte von Wörtern angezeigt werden und ignoriert werden sollen.
  • Zeichen, die nicht in einem Text erscheinen dürfen, der mithilfe dieses Wörterbuchs erkannt wird (verbotene Zeichen)
  • Alle erkennbaren Zeichen der Sprache
  • Sie können auch die Option Text kann arabische Ziffern, römische Ziffern und Abkürzungen enthalten aktivieren
  1. Sie können jetzt bei der Auswahl der Dokumentsprachen die neu erstelle Sprache auswählen.

Weitere Informationen über Dokumentsprachen finden Sie unter "Vor dem OCR-Vorgang zu berücksichtigende Dokumenteigenschaften".

Standardmäßig wird die Benutzersprache im Dokumentordner von FineReader gespeichert. Sie können außerdem alle Benutzersprachen und Benutzermuster in einer Datei speichern. Dazu klicken Sie im Menü Extras auf Optionen…, um das Dialogfeld Optionen zu öffnen, klicken Sie auf die Registerkarte Lesen und dann auf die Schaltfläche Speichern in Datei....

Erstellen einer Sprachgruppe

Wenn Sie eine bestimmte Sprachkombination regelmäßig verwenden, können Sie sich die Arbeit erleichtern, indem Sie die Sprachen zu einer Gruppe zusammenfassen.

  1. Klicken Sie im Menü Extras auf Spracheditor….
  2. Klicken Sie im Dialogfeld Spracheditor auf Neu….
  3. Im Dialogfeld Neue Sprache oder Gruppe wählen Sie Eine neue Gruppe von Sprachen erstellen und klicken Sie auf OK.
  4. Geben Sie im Dialogfeld Sprachgruppeneigenschaften einen Namen für die neue Gruppe ein und wählen Sie die gewünschten Sprachen aus.

Hinweis: Wenn Sie bereits wissen, dass bestimmte Zeichen nicht im Text vorkommen, können Sie diese sogenannten "unzulässigen Zeichen" gleich angeben. Auf diese Weise wird die Erkennung beschleunigt und qualitativ verbessert. Um unzulässige Zeichen anzugeben, klicken Sie im Dialogfeld Sprachgruppeneigenschaftenauf die Schaltfläche Erweitert… . Im Dialogfeld Erweiterte Sprachgruppeneigenschaften geben Sie im Feld Unzulässige Zeichen die unzulässigen Zeichen ein.

  1. Klicken Sie auf OK.

Die neu erstellte Gruppe wird im Hauptfenster zur Dropdownliste Dokumentsprache in der Hauptsymbolliste hinzugefügt.

Standardmäßig werden alle benutzerdefinierten Sprachgruppen im Dokumentordner von FineReader gespeichert. Sie können außerdem alle Benutzersprachen und Benutzermuster in einer Datei speichern. Dazu klicken Sie im Menü Extras auf Optionen…, um das Dialogfeld Optionen zu öffnen, klicken auf die Registerkarte Lesen und dann auf die Schaltfläche Speichern in Datei….

Tipp: Wenn Sie für ein Dokument eine bestimmte Sprachkombination benötigen, können Sie die gewünschten Sprachen auch ohne Erstellung einer speziellen Gruppe direkt auswählen.

  1. Dazu wählen Sie in der Dropdownliste Dokumentsprache die Option Weitere Sprachen….
  2. Wählen Sie im Dialogfeld Spracheditor Sprachen einzeln auswählen.
  3. Wählen Sie die gewünschten Sprachen aus und klicken Sie auf Abbrechen.

14.01.2020 17:26:18

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.