Erstellen einer Dokumentdefinition zum Verarbeiten nicht strukturierter und flexibler Dokumente

Mithilfe von ABBYY FlexiCapture können Dokumente verarbeitet werden, in denen die Darstellung der Informationen keiner festen Struktur folgt, z. B. Verträge, Briefe, Bestellungen oder Anhänge. Nicht strukturierte Dokumente mit Text oder Bildern, die durch leere Blätter oder Seiten mit Barcodes getrennt sind, werden verarbeitet und in durchsuchbare PDF-Dateien oder Grafikdateien exportiert.

Die Verarbeitung dieser Dokumente umfasst normalerweise das Konvertieren der Dokumente in elektronische Formate sowie das Durchführen einer Suche nach Schlüsselfeldwerten.

Wenn möglich, sollte die Suche nach Schlüsselfeldern (z. B. einer Vertragsnummer) in diesen Dokumenten anhand eines in ABBYY FlexiLayout Studio erstellten FlexiLayouts durchgeführt werden. Siehe Erstellen einer Dokumentdefinition zum Verarbeiten flexibler Dokumente.

Für die Verarbeitung nicht strukturierter Dokumente kann die NLP-Technologie verwendet werden. Diese Technologie nutzt NLP-Modelle für das Extrahieren von Informationen aus dem Text.

Wenn die automatische Suche nach Schlüsselfeldern nicht möglich ist, können Sie die Werte manuell eingeben. Erstellen Sie dazu eine Dokumentdefinition mit einem Feld (oder gegebenenfalls mit mehreren Feldern), und aktivieren Sie in den Erkennungseigenschaften dieses Felds die Option Keine Erkennung (Manueller Eingabeblock – wird manuell eingegeben). Beim Durchführen des Überprüfungsvorgangs können Sie dann die Schlüsselfeldwerte manuell eingeben.

Zum Aktivieren der Datenspeicherung müssen Sie den Export konfigurieren. Sie können Schlüsselfeldwerte in Dateien oder Datenbanken exportieren und Dokumentbilder in einem benutzerfreundlichen Format speichern. Sie können Dokumentbilder in Grafikdateien oder durchsuchbaren PDF-Dateien speichern.

Geben Sie Acht beim Zusammenstellen von Seiten zu Dokumenten. Bei nicht strukturierten Dokumenten kann fest definiert werden, zu welchem Dokument eine bestimmte Seite gehört. Für die automatische Zusammenstellung nicht strukturierter Dokumente wird empfohlen, Dokumente durch leere Blätter oder Seiten mit Barcodes zu trennen. Beim Hinzufügen von Bildern zu einem Stapel (durch Scannen, Hinzufügen aus einer Datei oder Erstellen eines Importprofils) müssen Sie dann die Option Für Bilder getrennt durch and select the value Leere Seiten oder Seiten mit Barcode auswählen, je nachdem welche Seiten als Trennseiten verwendet werden sollen. Die Seiten werden automatisch in Dokumenten zusammengestellt. Sie werden bis zur nächsten Trennseite dem aktuellen Dokument hinzugefügt. Ausführliche Informationen hierzu finden Sie unter Hinzufügen von Seitenbildern.

14.01.2021 14:17:18


Please leave your feedback about this article