Verwenden von Muster für die Indexierung

In ABBYY FineReader Server 14 können Feldbereichsmuster für das automatische Auffüllen von Indexfeldern verwendet werden. Feldbereichsmuster sind aber auch für das Beschleunigen der manuellen Indexierung nutzbar.

Ein Muster speichert Informationen über die Position der einzelnen Feldbereiche, von der die Informationen zu Indexierungszwecken extrahiert werden. Muster können für Dokumente mit dem gleichen Satz von Feldbereichen und deren entsprechenden Indexfelder erstellt werden.

Erstellen eines Muster

Um ein Muster zu erstellen, müssen Sie manuell mehrere Dokumente des gleichen Typs indexieren und die Ergebnisse in einer Musterdatei gespeichert werden. Gehen Sie dazu folgendermaßen vor:

  1. Öffnen Sie in der Remote-Verwaltungskonsole das Dialogfeld Workflow-Eigenschaften.
  2. Fügen Sie in der Registerkarte Indexierung den neuen Dokumenttyp und die gewünschten Indexfelder hinzu.
  3. Starten Sie die Verarbeitung mehrerer Dokumente, für die ein Muster erstellt werden soll.
    Tipp. Um die Arbeit zu erleichtern, können Sie mehrere Dokumente in einer Datei zusammenfassen. So kann Ihr Muster einfacher konfiguriert werden.
  4. Öffnen Sie die Datei auf der Indexierungsstation.
  5. Klicken Sie auf Extras > Mustereditor, um den Mustereditor zu öffnen.
  6. Auswählen des Textwerkzeugs.
    1. Wählen Sie auf der Seite einen Feldbereich aus.
    2. Klicken Sie mit der rechten Maustaste auf den markierten Feldbereich und wählen Sie dessen entsprechendes Indexfeld im Kontextmenü.
    3. Wiederholen Sie die Schritte a und b für die einzelnen Indexfelder in diesem Dokumenttyp.
  7. Wählen Sie einen Feldbereich versehentlich aus, können Sie die Auswahl mit dem Werkzeug Löschen rückgängig machen.
  8. Prüfen Sie auf sämtlichen nachfolgenden Seiten unbedingt, dass die von Ihnen ausgewählten Feldbereiche die zu extrahierenden Textabschnitte umschließen. Erweitern Sie die Feldbereiche bei Bedarf.
  9. Verwenden Sie den Befehl Muster speichern für das Speichern Ihr Muster.

Anwenden ein Muster

  1. Öffnen Sie in der Remote-Verwaltungskonsole das Dialogfeld Workflow-Eigenschaften.  
  2. Wählen Sie in der Registerkarte Indexierung den gewünschten Dokumenttyp aus und klicken Sie auf Bearbeiten. Klicken Sie im Dialogfeld Dokumenttyp auf Vorlage laden… und wählen Sie die entsprechende Vorlagendatei aus. In der Liste von Indexfeldern dieser Dokumenttypen wird eine Spalte angezeigt, in der angegeben wird, welche der Felder statisch sind.
  3. Starten Sie mit der Indexierung Ihrer Dokumente. Die Werte aus den Feldern der Vorlage werden automatisch in den entsprechenden Indexfeldern platziert.

Hinweis. Nur die Werte in den Feldern auf den ersten Seiten werden automatisch extrahiert.

Hinweis. Ein Wert, der nicht dem Typ von Indexfeld entspricht, wird nicht hinzugefügt.

Tipp. Enthält ein Stapel Dokumente verschiedenen Typs, können Sie eine Feldbereichsvorlage für die einzelnen Dokumenttypen erstellen und im Bereich Dokumenttyp der Indexierungsstation zwischen den Vorlagen wechseln.

26.03.2024 13:49:48

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.