Erstellen von NLP-Modellen
Erstellen von Dokumentfeldern
Für jede Einheit, die Sie extrahieren möchten, sollte ein entsprechendes Feld in der Dokumentdefinition erstellt werden. So erstellen Sie ein Feld:
1. Klicken Sie im Dokumentdefinitionseditor mit der rechten Maustaste auf den Namen des Dokumentbereichs und wählen Sie Feld erstellen.
- Erstellen Sie ein TextFeld.
- Wählen Sie auf der Registerkarte Allgemeindie OptionKann Bereich enthalten.
- Geben Sie im Name Feld einen Namen für das Feld ein, dass die Art der gespeicherten Daten widerspiegelt (wie z. B. , PreambleSegment).
Wichtig! Die Feldnamen dürfen keine Leereichen oder nicht englische Zeichen enthalten oder mit einer Zahl beginnen.Fenster Eigenschaften
Wiederholen Sie die oben genannten Schritte für jede Einheit.
Hinweis. Wird die Segmentierung verwendet, sollte für jedes Segment ein separates Textfeld erstellt werden.
Für jedes Segment, aus dem die Einheiten extrahiert werden, gilt:
- Erstellen Sie ein nicht wiederholbares Feld in einer wiederholten Gruppe.
- Wählen Sie die Option Textsegmentin den Feldeigenschaften.
- Wählen Sie die Option Mehrere Bereiche erlauben, wenn einige der Segmente auf verschiedenen Seiten beginnen und enden.
Erstellen eines NLP-Segmentierungsmodells
Die Segmentierung ist ein optionaler Schritt, sie verbessert aber die Genauigkeit und Geschwindigkeit des Extrahierens von Einheiten. Für die Segmentierung von Dokumenten wird ein spezielles NLP-Modell benötigt.
Wichtig! Sie können für jeden Dokumentbereich nur ein Segmentierungsmodell verwenden.
So erstellen Sie ein Segmentierungsmodell:
- Klicken Sie im Dokumentdefinitionseditor mit der rechten Maustaste auf den Namen des Dokumentbereichs.
- Wählen Sie Eigenschaften....
- Klicken Sie im daraufhin geöffneten Dialogfenster auf die Registerkarte NLP und klicken Sie dann auf Erstellen....
- Geben Sie einen Name für Ihr Segmentierungsmodell ein (wie z. B. SegmentationModel).
- Wählen Sie im Feld Modelltyp die Option Segmentierung.
- Wählen Sie in der Liste Sprache die erforderliche Sprache aus.
Erstellen eines NLP-Segmentierungsmodells
- Klicken Sie auf Nächstes....
- Geben Sie im nächsten Dialogfeld alle Felder an, in die Segmente extrahiert werden.
- Klicken Sie auf OK.
Sobald ein Segmentierungsmodell erstellt wurde, muss es auf einigen Beispieldokumenten trainiert werden.
Hinweis. Die Option Training zulassen ermöglicht Ihnen das Trainieren Ihres NLP-Modells während der Dokumentverarbeitung. Ihr NLP-Modell wird trainiert, wenn Sie die Feldextraktion mit einem Trainingsstapel für die Feldextraktion trainieren. Die Trainingsergebnisse können entweder deaktiviert oder gelöscht werden. Um die Trainingsergebnisse zu deaktivieren, klicken Sie mit der rechten Maustaste auf den Trainingsstapel und wählen das Element Deaktiviert im Kontextmenü aus. Um die Trainingsergebnisse zu löschen, klicken Sie mit der rechten Maustaste auf den Trainingsstapel und wählen das Element Löschen im Kontextmenü aus.
Erstellen eines NLP-Modells für das Extrahieren von Einheiten
Um Einheiten zu extrahieren, benötigen Sie ein NLP-Modell für das Extrahieren von Einheiten, das auf manuell markierten Dokumenten trainiert wurde. So erstellen Sie ein NLP-Modell:
- Öffnen Sie im Dokumentdefinitionseditordie Eigenschaften des Dokumentbereichs und klicken Sie auf die Registerkarte NLP.
- Klicken Sie auf Erstellen....
- Geben Sie einen Name für Ihr NLP-Modell ein (wie z. B. EntitiesExtraction).
- Wählen Sie als Datenquelle entweder den entsprechenden Bereich (wenn keine Segmentierung verwendet wird) oder das Segment (wenn Sie sich für eine Segmentierung entschieden haben).
- Wählen Sie im FeldModell-Typ die OptionExtraktion.
- Wählen Sie in der Liste Sprache die erforderliche Sprache aus.
- Klicken Sie auf Nächstes....
- Wählen Sie die Ergebnisfelder aus, die aus dem ausgewählten Dokumentabschnitt oder Segment extrahiert werden sollen.
Wiederholen Sie die Schritte 1 bis 9 für jedes Dokumentsegment oder jeden Dokumentabschnitt, aus dem Einheiten extrahiert werden sollen.
- Klicken Sie auf Dokumentdefinition > Speichern, um Ihre Dokumentdefinition zu speichern.
- Klicken Sie aufDokumentdefinition > Schließen, umden Dokumentdefinitionseditor zu schließen.
- Klicken Sie auf Dokumentdefinition > Veröffentlichen, um Ihre Dokumentdefinition zu veröffentlichen.
Sobald ein NLP-Modell für das Extrahieren von Einheiten erstellt wurde, muss es auf einigen Beispieldokumenten trainiert werden.
Hinweis. Die Option Training zulassen ermöglicht Ihnen das Trainieren Ihres NLP-Modells während der Dokumentverarbeitung. Ihr NLP-Modell wird trainiert, wenn Sie die Feldextraktion mit einem Trainingsstapel für die Feldextraktion trainieren. Die Trainingsergebnisse können entweder deaktiviert oder gelöscht werden. Um die Trainingsergebnisse zu deaktivieren, klicken Sie mit der rechten Maustaste auf den Trainingsstapel und wählen das Element Deaktiviert im Kontextmenü aus. Um die Trainingsergebnisse zu löschen, klicken Sie mit der rechten Maustaste auf den Trainingsstapel und wählen das Element Löschen im Kontextmenü aus.
12.04.2024 18:16:01