Klassifizierung anhand einer Unternehmensdatenbank
Wann die Verwendung einer unternehmensbasierten Klassifizierung sinnvoll ist
Die Klassifizierung ordnet jedes Dokument einer bestimmten Klasse zu (siehe Abschnitt Klassifizierung für weitere Informationen). Jedes dokumentenausgebende Unternehmen kann als separate Klasse behandelt werden.
In der Regel sehen Dokumente, die von demselben Unternehmen stammen, ähnlich aus und haben dieselben Feldtypen an denselben Positionen, was die Datenextraktion vereinfacht.
Dokumente können mithilfe einer Unternehmensdatenbank klassifiziert werden. Diese Datenbank sollte in dem jeweiligen ABBYY FlexiCapture-Projekt einbezogen sein. Um diese Datenbank zu befüllen, können Sie die in Ihrem ERP-System gespeicherte Unternehmensliste verwenden. ABBYY FlexiCapture wird die Unternehmensdatenbank regelmäßig mit den aktuellen Daten Ihres ERP-Systems synchronisieren. Wenn Sie noch keine Unternehmensdatenbank besitzen, können Sie während der Erfassung von Daten aus Dokumenten eine erstellen und Unternehmen während der Phase Dokumentüberprüfung einer Datenbank hinzufügen.
Das Programm sucht nur auf der ersten und letzten Seite jedes Dokuments nach den erforderlichen Feldern, da sich auf diesen Seiten in der Regel Unternehmensinformationen befinden.
Die unternehmensbasierte Klassifizierung bietet gegenüber anderen Klassifizierungsmethoden folgende Vorteile:
- Es ist nicht erforderlich, Beispieldokumentbilder zu sammeln, um ein Trainingsset zu erstellen, was viel Zeit und Mühe erfordert.
- Dokumente können in bis zu 100.000 Klassen klassifiziert werden, was wesentlich mehr ist, als bei der bild- und textbasierten Klassifizierung.
Die unternehmensbasierte Klassifizierung kann für die Feldextrahierung verwendet werden. Jedes Unternehmen hat seine eigene Bereichsvariante, für die ein separates FlexiLayout trainiert oder erstellt werden kann.
Hinweis. Innerhalb eines Projekts kann Folgendes gleichzeitig verwendet werden:
- ein Dokumenttyp-Klassifizierer auf Stapeltyp- oder Projektebene
- ein unternehmensbasierter Klassifizierer für Dokumente desselben Typs auf Ebene der Dokumentdefinition
Zuerst führt das Programm den Dokumenttyp-Klassifizierer aus, um die Klasse der vorliegenden Dokumente zu bestimmen, und dann führt es den unternehmensbasierten Klassifizierer für die Dokumente der erforderlichen Klasse aus.
Die Dokumentvarianten, die der Klassifizierer anhand der Unternehmensdatenbank erkennt, identifizieren eindeutig die trainierten FlexiLayouts, die für das Training verwendet werden sollen. Das bedeutet, das Feldtraining wird für jedes Unternehmen unabhängig voneinander ausgeführt.
Konfiguration der unternehmensbasierten Klassifizierung
Die unternehmensbasierte Klassifizierung wird innerhalb einer Dokumentdefinition durchgeführt, d. h. für Dokumente desselben Typs. Dokumente desselben Typs enthalten identische Sätze von Datenfeldern, die extrahiert werden müssen (siehe Abschnitt Dokumentdefinitionen für weitere Informationen).
Klassifizierung von Dokumenten mithilfe einer Unternehmensdatenbank:
- Klicken Sie mit der rechten Maustaste auf einen Dokumentbereich und auf Eigenschaften oder öffnen Sie den Dokumentdefinitionseditor und klicken Sie auf Dokumentdefinition → Eigenschaften der Dokumentdefinition.
- Wählen Sie auf der Registerkarte Datensätzeeinen Datensatz von der Liste und klicken Sie auf die Schaltfläche Einrichtung....
- Wählen Sie die Option Unternehmensdatenbanken verwenden. Standardmäßig sind die erforderlichen Spalten und deren Typen bereits im Datensatz angegeben. (Ein Datensatz besteht im Wesentlichen aus einer Tabelle mit einer Liste von Feldern, in denen nach Unternehmen gesucht werden soll; Benutzer können diese Tabelle nicht ändern.)
- Um eine Verbindung zwischen Datensatz und einer ODBC-kompatiblen Datenbank herzustellen, muss jedes Feld im Datensatz dessen Gegenstück in der Datenbank zugeordnet werden. Für detaillierte Anweisungen siehe Verbinden von Datenbanken für Lieferanten und Geschäftseinheiten.
Hinweis. Das Programm sucht nach Unternehmen, deren Datensatzfelder den übereinstimmenden Datenbankfeldern zugeordnet wurden. Sie müssen mindestens ein Feld zuordnen (wie z. B. Name des Unternehmens). Ist für ein Datensatzfeld kein übereinstimmendes Datenbankfeld vorhanden, geben Sie bei der Zuordnung eines Feldes Keine an.
Hinweis. Für die Suche nach Unternehmensinformationen in einem Dokument werden nur bestimmte Felder verwendet. Neben diesen Feldern wird ein kleines Schlosssymbol angezeigt. Sie können bei der Konfiguration einer unternehmensbasierten Klassifizierung eigene Felder hinzufügen, diese Felder werden aber nur für die Anzeige von Informationen verwendet. - Um nach Namen von Unternehmen mit mehr als einer Variante zu suchen, verwenden Sie die Normalisierung, einen Prozess zur Reduzierung aller Namensvarianten auf einen Standardname. Geben Sie im Dialogfeld Spaltenzuordnung der Datensätzeden erforderlichen Typ von Normalisierung in das Feld Normalisierung ein (siehe Normalisierung von Werten in Datensätzen für weitere Informationen).
Manchmal können Unternehmensnamen im Voraus bekannt sein – beispielsweise aus den Datenquellenparametern (d. h. der Name des Scanoperators oder die E-Mail-Adresse des Absenders).
ABBYY FlexiCapture verfügt über eine Funktion, mit der der Lieferant und die Unterabteilung des Unternehmens vor der automatischen Erkennung explizit angegeben werden können.
Wenn Sie die Unterabteilungen explizit angeben möchten, legen Sie den Wert für den Dokumentregistrierungsparameter fc_Predefined:PredefinedSectionVariantId für die Kennung (ID) des entsprechenden Datensatzes im Datensatz fest. In diesem Fall wird die automatische Unternehmenserkennung trotzdem für den angegebenen Eintrag durchgeführt. Als Ergebnis erhalten Sie den explizit angegebenen Namen des Unternehmens und einen Zuverlässigkeitswert, der angibt, wie gut der explizit angegebene Name mit dem aus einem Bild extrahierten Namen übereinstimmt.
Hinweis. Diese Methode kann nur verwendet werden, wenn ein Bereich in einem Dokument mehrere Varianten enthält.
Überprüfen und Bearbeiten unternehmensbasierter Klassifizierungsergebnisse
Bei der Klassifizierung von Dokumenten mithilfe einer Unternehmensdatenbank ist kein Training erforderlich, da das Programm in einer vordefinierten Liste von Unternehmensnamen nach Unternehmen suchen wird. Klassifizierungsfehler können von Operatoren korrigiert werden. Wann immer das Programm ein Dokument dem falschen Unternehmen zuordnet, kann der Operator den korrekten Namen des Unternehmens auswählen und in der Datenbank speichern. Das Programm wird dann in zukünftigen Klassifizierungen diese korrekten Informationen verwenden.
Um dem Operator die Korrektur von Klassifizierungsfehlern zu ermöglichen, müssen die Klassifizierungsergebnisse auf dem Datenformular angezeigt und eine Schaltfläche hinzugefügt werden, mit der eine Feldsuche initiiert werden kann. Führen Sie dafür die folgenden Schritte aus:
- Erstellen Sie ein Dienstfeld.
- Klicken Sie im Dokumentdefinitionseditor auf Feld erstellen → Dienstfeld. Klicken Sie als Nächstes in den Feldeigenschaften auf die Registerkarte Datenquelleund wählen Sie Varianten-ID für flexiblen Bereich aus der Liste Quelle.
- Erstellen Sie so viele Dienstfelder, wie es für die Identifizierung des Unternehmens erforderlich ist (z. B. IBAN und MWSTID).
- Erstellen einer Regel für die Datenbanküberprüfung:
- Klicken Sie mit der rechten Maustaste auf Eigenschaften..., klicken Sie auf die Registerkarte Regelnund dann auf die Schaltfläche Neue Regel....
- Wählen Sie Datenbanküberprüfung aus der Liste und klicken Sie auf OK.
- Wählen Sie im Feld Datenquelle die OptionDatensätze. Wählen Sie dann im Feld Datensätzeden benötigten Datensatz aus.
- Wählen Sie im Feld Feld, in dem die Datensatz-ID gespeichert wird das Dienstfeld aus, das Sie in Schritt 1 erstellt haben.
- Klicken Sie auf die Schaltfläche Hinzufügen und geben sie die erforderlichen Dokument- und Datenbankfelder an. Stimmen die Werte aus Dokument und Datenbankfelder nicht überein, wählen Sie die Optionen für Suchen und Ersetzen (Wert aus Datenbank eingeben → Bei unterschiedlichen Werten).
Ab sofort enthalten alle vom Klassifizierer erkannten Felder zu unternehmensbasierten Klassifizierungszwecken einen Bereich.
- Fügen Sie dem Datenformular eine Schaltfläche hinzu, mit der das Dialogfeld Suchen geöffnet wird:
- Klicken Sie mit der rechten Maustaste auf die Stelle im Datenformular, an der Sie die Schaltfläche platzieren möchten, und klicken Sie auf Schaltfläche einfügen im Kontextmenü.
- Wählen Sie auf der Registerkarte Format die Datenbanküberprüfung aus, die Sie in Schritt 2 erstellt haben.
- Geben Sie auf der Registerkarte Position einen Namen für die Schaltfläche an.
Ein Überprüfungsoperator kann jetzt auf diese Schaltfläche im Datenformular klicken, um das Dialogfeld Suchen zu öffnen.
Verbesserung der unternehmensbasierten Klassifizierung
Angeben von Schlüsselwörtern und regulären Ausdrücken
Sie können Schlüsselwörter und reguläre Ausdrücke angeben, um die Erkennung von Unternehmen zu verbessern. Verwenden Sie für Schlüsselwörter Zeichenfolgen, die ein Unternehmen eindeutig identifizieren, wie z. B. Daten von den Feldern MWSTID oder IBAN.
Bearbeitung von Unternehmenseinträgen
Eine weitere Möglichkeit zur Verbesserung der Erkennung von Unternehmen ist die Bearbeitung der Unternehmenseinträge, die von ABBYY FlexiCapture gespeichert werden. Für jedes Unternehmen können mehrere Varianten und Adressen angegeben werden. Dies kann von einem Administrator mithilfe des Dokumentdefinitionseditor oder über einen Überprüfungsoperator erledigt werden.
Bitte beachten Sie, dass nur die von ABBYY FlexiCapture gespeicherten Unternehmenseinträge geändert werden. Selbst bei aktivierter Synchronisierung mit einer externen Datenbank (z. B. ein ERP-System) werden die vom Administrator oder von den Überprüfungsoperatoren durchgeführten Änderungen zur externen Datenbank übertragen.
Operatoren können neue Einträge hinzufügen und vorhandene Einträge bearbeiten, wenn es per Dokumentdefinition erlaubt ist.
Standardmäßig ist es den Operatoren nicht erlaubt, Einträge hinzuzufügen oder zu bearbeiten. Um das Hinzufügen und Bearbeiten von Einträgen durch Operatoren zu erlauben:
- Klicken Sie im Dokumentdefinitionseditor auf Dokumentdefinition → Eigenschaften der Dokumentdefinition....
- Im daraufhin angezeigten Dialogfeld klicken Sie auf die Registerkarte Datensätze.
- Wählen Sie einen Datensatz aus der Liste aus und klicken Sie auf die Schaltfläche Einrichtung....
- Wählen Sie die Optionen Operatoren können Datensätze hinzufügen und Operatoren können Datensätze bearbeiten.
Um Operatoren am Hinzufügen und Bearbeiten von Einträgen zu hindern, deaktivieren Sie oben die zwei Optionen.
12.04.2024 18:16:01