Vorbereitung der Datenbanken für Lieferanten und Geschäftseinheiten

ODBC-kompatible Datenbanken

ABBYY FlexiCapture for Invoices ermöglicht Ihnen die Verbindung eines Datensatzes mit einer ODBC-kompatiblen Datenbank (Siehe Verbindung mit Datenbanken für Lieferanten und Geschäftseinheiten), um die Daten einmal zu laden oder um einen Datensatz anhand von Daten aus einer externen Datenbank in regelmäßigen Abständen zu aktualisieren (Siehe Aktualisierung von Datensätzen).

Daher sollte Ihr erster Schritt die Bereitstellung der externen Daten in einer ODBC-kompatiblen Datenbank sein, wie z. B. Microsoft Access, Microsoft SQL Server oder Oracle.

Beseitigung doppelter Datensätze in der externen Datenbank

Es ist wichtig, das Feld in der externen Datenbank für Lieferanten (oder Geschäftseinheiten) zu bestimmen, dessen Wert als Ergebnis der Erkennung des Lieferanten (oder der Geschäftseinheit) in einer Rechnung abgerufen werden soll. Dieses Feld (oder eine Reihe von Feldern) wird dann zum einzigartigen Schlüssel das Datensatzes.

Der einzigartige Schlüssel des Datensatzes Geschäftseinheit ist das Feld ID (Siehe Spalten im Datensatz BusinessUnits). Aus der Perspektive des Benutzers ist dieses Feld das Ergebnis der ABBYY FlexiCapture for Invoices-Erkennung der Geschäftseinheit, für die die gegebene Rechnung ausgestellt wurde.

Der einzigartige Schlüssel eines Lieferantendatensatzes muss der Wert sein, der dem externen Informationssystem als Ergebnis der ABBYY FlexiCapture for Invoices-Erkennung des Lieferanten übergeben wurde, der die gegebene Rechnung ausgestellt hat. Wird eine Lieferantentabelle verwendet, muss der einzigartige Schlüssel dem Feld ID des Datensatzes zugeordnet sein. Dieser Wert wird an das externe Informationssystem weitergegeben, sobald der Lieferant in der Rechnung erkannt wird.

Planen Sie in einem Projekt die Verarbeitung von Rechnungen, die für verschiedene Geschäftseinheiten Ihres Unternehmens ausgestellt wurden, wobei jede davon ihre eigene Lieferantendatenbank besitzt, muss der einzigartige Schlüssel der jeweiligen Geschäftseinheiten der Spalte BusinessUnitId des Datensatzes Vendors und der Schlüssel der jeweiligen Geschäftseinheit der Spalte ID des Datensatzes Vendors zugeordnet werden. Daher muss der einzigartige Schlüssel des Lieferantendatensatzes, der an das externe Informationssystem weitergegeben wird, aus dem Paar ID und BusinessUnitId bestehen. (Siehe Spalten im Datensatz Vendors).

In den folgenden Erläuterungen berücksichtigen wir nur die Lieferantenerkennung, da die Situation bei Geschäftseinheiten komplett identisch ist.

Der einzigartige Schlüssel eines Datensatzes muss die einzigartige Kombination von Parametern bestimmen, die für die Lieferantenerkennung verwendet werden. Sehr oft wird ein externes Informationssystem einen Lieferantendatensatz als einzigartig ansehen und sich dabei auf mehr Parameter stützen, als in der Rechnung angegeben sind und/oder für die Lieferantenerkennung verwendet werden.

Beispiel: Ein externes Informationssystem erwartet die Kennung MCN_USD, wenn der Lieferant Mein Firmenname AG eine Rechnung in US-Dollar ausstellt, oder erwartet die Kennung MCN_EUR, wenn das gleiche Unternehmen eine Rechnung in Euro ausgestellt hat. Auch wenn die Währung in der Rechnung angegeben ist (und auch der Grund, wann MCN_USD zurückgegeben werden muss, kann vom Grund, wann die Kennung MCN_EUR zurückgegeben werden muss, unterschieden werden), wird die Währung nicht zur Erkennung des Lieferanten verwendet.

Daher kann der Erkennungsmechanismus für den Lieferanten nicht zwischen MCN_USD und MCN_EUR entscheiden.

In Fällen wie diesen erstellen Sie eine Kennung MCN, die sowohl MCN_USD als auch MCN_EUR entspricht, und die dann zurückgegeben wird, sobald der Lieferant erkannt wird. Als Nächstes erstellen Sie eine Regel in der Dokumentdefinition, die zwischen MCN_USD und MCN_EUR je nach Währung der gegebenen Rechnung auswählt.

Um zu generalisieren, muss die einzigartige Kennung eines Lieferanteneintrags einen einzigartigen Parametersatz enthalten, der für die Lieferantenerkennung verwendet wird, wie z. B. Firmenname, Firmenadresse, Steuer-IDs (USt-IdNr, Nationale Steuer-ID) und die internationale Bankkontonummer (IBAN). (Siehe Spalten im Datensatz Vendors). Nur dann ist es dem Lieferantenerkennungsmechanismus möglich, den korrekten Lieferanteneintrag für eine Rechnung auszuwählen.

Hinweis. Als Nächstes kann das Programm zusätzliche Felder erfassen und Regeln in der Dokumentdefinition für die Feinabstimmung des Ergebnisses anwenden, um so den benötigten Wert zu erhalten.

Entspricht der gleiche (oder leicht veränderte) Parametersatz, der für die Lieferantenerkennung verwendet wird, mehreren einzigartigen Schlüsseln, wird es dem Programm nicht möglich sein, nur einen Schlüssel auszuwählen, die Lieferantenerkennung erfolgt willkürlich und die Qualität nimmt ab.

Der Grund dafür ist folgender. Wenn das Programm die auf der Rechnungen gedruckten Daten für eine zuverlässige Erkennung des Lieferanten Mein Firmenname verwenden kann, aber mehrere Datensätze (MCN1, MCN2, ... MCNN) in dem Datensatz vorhanden sind, der den Rechnungsdaten entspricht, entscheidet das Programm evtl. zugunsten eines anderen Datensatzes, was für die Rechnungsdaten eine schlechtere Übereinstimmung bedeutet, aber zu weniger Einträgen führt. Das wird letztendlich zu einer falschen Erkennung des Lieferanten führen.

Daher ist die Beseitigung doppelter Datensätze in der externen Datenbank sehr wichtig und die externe Datenbank muss eine Spalte enthalten, die einen eindeutigen Wert für jeden eindeutigen Wertesatz der Datensatzfelder enthält, die zur Lieferantenerkennung verwendet werden.

Bei der Verbindung zum Datensatz werden die Reihen mit identischen Werten in der Spalte, die dem einzigartigen Schlüssel des Datensatzes zugeordnet werden, automatisch auf einen Eintrag im Datensatz reduziert.

Komplexe Spalten eines Datensatzes

Ein Datensatz kann mehrere Werte für eine logische Spalte eines Firmeneintrags speichern.

Die Speicherung mehrerer Werte ist erforderlich, da solche Firmenparameter wie z. B. Firmenname, Straße usw. von Rechnung zu Rechnung unterschiedlich sein können (z. B. haben wir "Mein Firmenname" und "MCN-AG"), um aber das Unternehmen zuverlässig zu erkennen, muss der Text im Datensatz ziemlich genau dem in einem Rechnungsbild erfassten Text entsprechen. Darüber hinaus können Unternehmen mehrere Bankkonten oder andere Attribute besitzen.

Hinweis. Note that multiple-value columns in Data sets should be used to store the same information written in different ways. For example, "Karl Marx Street" and "K. Marx str." are two different ways of writing the same address. However, company branches in London and Berlin should have two separate records.

Werte für "multiplizierte" Spalten können einer externen Datenbank entnommen werden (z. B. kann eine Tabelle der Lieferanten ein bis fünf Bankdaten für jedes Unternehmen enthalten) oder sie können vom Benutzer während der Datenerfassung hinzugefügt werden (ein Operator möchte beispielsweise dem Datensatz eine häufig verwendete Variante eines Firmennamens hinzufügen, die der externen Datenbank unbekannt ist).

Datensätze verwenden die Denormalisierung von Spalten, d. h. sie speichern die Daten in der folgenden Form:

Einzigartiger Schlüssel des Datensatzes* Name1 Name2 ... NameN ...
1 Mein Firmenname MCN-AG ... <leerer Wert> ...
2 Die zweite Firma, AG. S-Firma ... <leerer Wert> ...
... ... ... ... ... ...

Für ein logisches Feld eines Eintrags, nennen wir es Name, werden mehrere Spalten im Datensatz erstellt, in denen alle möglichen Werte des logischen Feldes gespeichert werden. Daher könnte Name als "komplexe Spalte" bezeichnet werden.

Bei der Verbindung einer Tabelle (oder einer Ansicht) einer externen Datenbank kann wie oben beschrieben die Spaltendenormalisierung oder eine eher übliche Zeilendenormalisierung verwendet werden. Im zweiten Fall müssen die Zeilen, die im Datensatz in Parameter eines Eintrags zusammengeführt werden sollen, den gleichen Wert der Spalte besitzen, die dem einzigartigen Schlüssel im Datensatz entspricht. Beispiel:

Die dem einzigartigen Schlüssel im Datensatz zugeordnete Spalte* Name ...
1 Mein Firmenname ...
1 MCN-AG ...
... ... ...
N <leerer Wert> ...
2 Die zweite Firma, AG. ...
2 S-Firma ...
... ... ...
N <leerer Wert> ...
... ... ...

*Der einzigartige Schlüssel eines Datensatzes BusinessUnits ist das Feld ID. Der einzigartige Schlüssel eines Datensatzes Vendors ist entweder das Feld ID oder das Feldpaar ID und BusinessUnitId, ja nach Einstellung.. (Siehe Spalten im Datensatz Vendors)

13.04.2021 11:12:26


Please leave your feedback about this article