Glossar

A

ABBYY FlexiCapture

Eine Softwarelösung für die Erfassung von Daten aus unterschiedlichen Dokumenttypen – z. B. strukturierter (statischer Formulare), teilweise strukturierter (flexibler Formulare und Dokumente) und nicht strukturierter Dokumente – in einem Durchgang.

ABBYY FlexiLayout Studio

Ein Programm, mit dem Sie eine flexible Beschreibung (FlexiLayout) der Dokumentstruktur erstellen können, die anschließend für die automatische Dokumenterkennung verwendet werden kann.

ABBYY FormDesigner

Mithilfe von ABBYY FormDesigner können Sie Layouts für maschinenlesbare Formulare entwerfen. Nach der Vervielfältigung und dem Ausfüllen können diese Formulare mit dem automatisierten Formulareingabesystem von ABBYY FlexiCapture verarbeitet werden. Das Entwerfen eines Formularlayouts ist ein wichtiger Schritt, da die Qualität des entworfenen Layouts (ob es maschinenlesbar ist) das Resultat aller nachfolgenden Arbeitsschritte bestimmt: Scannen, Erkennung, Überprüfung und Export.

ABBYY FlexiCapture for Invoices

Ein ABBYY FlexiCapture ist eine leicht zu bedienende, intelligente Softwarelösung für die Verarbeitung von Rechnungen.

ADF

Englische Abkürzung für „Automatic Document Feeder“ (automatische Dokumentzufuhr). Eine Vorrichtung zur automatischen Dokumentzufuhr, mit der Sie mehrere Dokumente scannen können, ohne zwischenzeitlich eingreifen zu müssen.

Administrator

Ein Benutzer von ABBYY FlexiCapture, der berechtigt ist, das Programm für die Dokumenteingabe zu konfigurieren: Dokumentdefinitionen erstellen und bearbeiten und Profile importieren.

Alphabet

Ein in der beschriebenen Sprache verwendeter Zeichensatz.

Anker

Ein statisches Element in Form eines schwarzen Quadrats, Rechtecks, Kreuzes oder einer Ecke, das für die Zuordnung von Dokumentdefinitionen verwendet wird.

Details…

Ankerbarcode

Statisches Element in Form eines Barcodes, der nicht für das Extrahieren von Daten vorgesehen ist. Ankerbarcodes können für die Zuordnung oder Identifizierung von Dokumentdefinitionen verwendet werden.

Ankertext

Statisches Element, das Text auf einem leeren Formular darstellt, der nicht zum Extrahieren von Daten vorgesehen ist. Dabei kann es sich um erklärenden Text oder eine Kopfzeile handeln. Ankertexte können für die Zuordnung oder Identifizierung von Dokumentdefinitionen verwendet werden.

Winkel

Ein Anker in Form eines Winkels.

Anhang

Seiten, die keine Felder enthalten, aber in die Dokumentzusammenstellung einbezogen werden. Aus diesen Seiten werden zwar keine Daten extrahiert, sie können aber als Bilder oder durchsuchbare PDF-Dateien gespeichert werden.

Zusammenstellungsfehler

Dieser Fehler tritt auf, wenn ein Dokument, das in der Dokumentzusammenstellung erstellt wurde, Seiten aus anderen Dokumente enthält oder wenn die Reihenfolge der Seiten dieses Dokuments falsch ist oder wenn die Werte der Schlüsselfelder auf den Seiten eines Dokuments nicht identisch sind.

Automatisches Lernen

Die Fähigkeit von ABBYY FlexiCapture, automatisch zu lernen, neue Felder zu erkennen und Dokumenttypen zu identifizieren.

B

Barcode

Ein maschinenlesbares Formularelement, das durch abwechselnde weiße und schwarze Streifen gleicher Länge dargestellt wird und der Kodierung digitaler Informationen dient. Barcodes können in einem Dokument für das Extrahieren von Informationen (Barcodefeld) oder das Zuordnen und Identifizieren einer Dokumentdefinition (Ankerbarcode) verwendet werden.

Barcodefeld

Ein Dokumentdefinitionsfeld, das einen für die Erkennung vorgesehenen Barcode enthält.

Barcodeerkennung

Konvertierung eines grafischen Barcodebilds in Zahlen oder Text.

Stapeltyp

Die Eigenschaft eines Stapels, die definiert, wie Dokumente in den entsprechenden Stapeln verarbeitet werden müssen.

Lineares Schwarz-Weiß-Formular

Ein Formular, auf dem Informationsfelder durch Ränder aus einfachen Linien begrenzt sind, die beim Scannen nicht verschwinden.

Schwarzes Quadrat

Ein Anker in Form eines schwarzen Quadrats.

Helligkeit

Ein Schwellenwert für die Lichtempfindlichkeit, der angibt, ab welchem Wert der Scanner Halbtöne von Graustufen als Weiß wiedergibt.

C

Auswahlfeld

Ein maschinenlesbares Formularelement, das von der Person, die das Formular ausfüllt, mit einer Markierung (Häkchen, Kreuz, Punkt usw.) versehen werden soll.

Auswahlfeld

Ein Dokumentdefinitionsfeld, das ein Auswahlkästchen enthält.

Auswahlfeldgruppe

Ein Element eines maschinenlesbaren Formulars, in dem mehrere nahe beieinander stehende Auswahlkästchen zusammengefasst werden. In einer Gruppe von Auswahlkästchen können eine oder mehrere Möglichkeiten markiert werden.

Auswahlgruppenfeld

Ein Dokumentdefinitionsfeld, das eine Auswahlfeldgruppe enthält.

Klassifizierer

Ein in FlexiLayout Studio erstelltes Projekt zur vorläufigen Identifizierung von Seiten vor der Anwendung von Dokumentdefinitionen sowie zur Auswahl der zuzuordnenden FlexiLayout- oder Layoutalternative.

Zeichenkodierung

Eine Tabelle mit Werten, die den Zeichensatz einer bestimmten Sprache beschreiben.

Formular mit farbigem Hintergrund

Ein Formular, in dem alle Informationsfelder als weiße Rechtecke auf einem farbigen Hintergrund erscheinen, der beim Scannen verschwindet.

Kontrast

Das Verhältnis zwischen der Helligkeit des dunkelsten und hellsten Bereichs eines Bilds.

Steuerung

Ein Text, Feld oder Schaltflächenelement im Datenformular.

Korrigiertes Auswahlfeld

Ein Auswahlkästchen, das fälschlicherweise markiert und anschließend durchgestrichen wurde. Wenn für das Auswahlfeld die Option Korrekturen zulassen zulassen aktiviert wurde, erkennt die Software das durchgestrichene Auswahlkästchen als nicht markiert.

Kreuz

Ein Anker in Form eines Kreuzes.

Benutzerdefinierter Datentyp

Benutzerdefinierter Datentyp.

D

Datenbanksuche

Zuordnung erkannter Daten zu den entsprechenden Datenbankeinträgen.

Datensatz

Daten, die für automatisierte Dokumentüberprüfungen verwendet werden. Ein Datensatz kann als Tabelle in ABBYY FlexiCapture gespeichert und entsprechend eines Zeitplans synchronisiert oder von einer externen Quelle abgerufen werden.

Datentyp

Ein Feldattribut, das bekannte Einschränkungen für die möglichen Feldwerte beschreibt. Mit dem Datentyp wird während der Felderkennung die Anzahl der möglichen Erkennungsvarianten reduziert.

Details…

Beschreibungsdatei

Eine Zusatzdatei, in der definiert ist, wie ein Stapel zusammengesetzt wird, wenn Bilder aus einem Hot Folder hinzugefügt werden.

Wörterbuch

Eine Liste von Wörtern, mit denen ein bestimmter Datentyp bestimmt wird.

Details…

Dokument

Eine Kombination aus mehreren Seitenbildern und den Daten, die aus den Seiten extrahiert wurden.

Dokumentstapel

Eine Kombination aus Dokumenten, die vom Benutzer zusammengestellt wurden. Normalerweise enthält ein Stapel Dokumente, die in einem Durchgang gescannt oder aus einem bestimmten Ordner importiert wurden.

Dokumentklasse

Eine Reihe von Dokumenten oder Seiten, die mehrere gemeinsame Merkmale aufweisen.

Dokumentdaten

Daten, die nach der Verarbeitung (Erkennung, Überprüfung und Bearbeitung der Erkennungsergebnisse) der Seitenbilder eines Dokuments erfasst werden.

Dokumentdefinition

Mit einer Dokumentdefinition werden die Verfahren für das Erkennen und Verarbeiten eines bestimmten Dokumenttyps definiert. Sie enthält folgende Angaben:

  • Die Dokumentstruktur, d. h. eine Beschreibung der zulässigen Reihenfolge der Seiten für Dokumente dieses Typs, die definiert, wie Dokumente zusammengestellt werden sollen
  • Definitionen von Dokumentbereichen
  • Eine Liste von Regeln, denen die Felddaten entsprechen müssen
  • Die Position von Feldern und ihrer Signaturen im Datenfenster (Datenformularansicht)
  • Einstellungen für den Dokumentenexport
  • Einstellungen für die Dokumentenverarbeitung

Identifizierung von Dokumentdefinitionen

Vorgang, bei dem die passende Dokumentdefinition mithilfe von Kennungen ausgewählt wird.

Zuordnung von Dokumentdefinitionen

Vorgang, bei dem eine Dokumentdefinition ausgewählt wird und ihre Felder einem Bild zugeordnet werden.

Veröffentlichung von Dokumentdefinitionen

Freigabe einer neuen Dokumentdefinitionsversion nach deren Bearbeitung. Während veröffentlichte Versionen bei der Verarbeitung von Dokumenten aus Arbeitsstapeln zum Einsatz kommen, können nicht veröffentlichte, lokale Versionen nur bei der Verarbeitung von Dokumentdefinitionen aus Teststapeln verwendet werden.

Dokumentdefinitionsbereich

Komponente einer Dokumentdefinition. Der Dokumentdefinitionsbereich entspricht einer oder mehreren Seiten, die einen logisch verknüpften Satz von Feldern enthalten. Die Felder innerhalb eines Bereichs können sich auch über mehrere Seiten erstrecken (z. B. mehrseitige Tabellen), sofern sich die Feldsätze der unterschiedlichen Bereiche nicht überschneiden.

Dokumentdefinitionsbereiche können flexibel oder statisch sein.

Dokumentkennung

Der Vorgang der Zuweisung von Dokumenten zu einem von mehreren vorgegebenen Dokumenttypen.

Dokumentenmappe

Eine Reihe logisch zusammengehöriger Dokumente, die für einen bestimmten Zweck verwendet werden. Ein Geschäftsprozess kann beispielsweise durch eine Reihe von Dokumenten eingeleitet werden, die von einem Antragsteller bereitgestellt werden und aus einem ausgefüllten Antragsformular und einigen Begleitdokumenten bestehen. Abhängig von den Angaben des Antragstellers auf dem Antragsformular können einige der Begleitdokumente optional sein, während andere dem Antrag beizufügen sind.

Text des Dokuments

Der gesamte Text eines Dokuments, der bei der vorläufigen Erkennung erfasst wurde, bevor das FlexiLayout angewandt wird. Sie können diesen Text speichern (erfordert zusätzlichen Speicherplatz auf der Festplatte), damit er während der Überprüfung zur Verfügung steht.

Dokumententyp

Eine Reihe von Dokumenten, die mehrere Merkmale gemeinsam haben und eine bestimmte Rolle in Geschäftsprozessen spielen.

Einige Beispiele für Dokumenttypen sind Rechnungen, Verträge und Pässe.

Dokumentvariante

Eine Reihe von Dokumenten desselben Typs, die mehrere Merkmale gemeinsam haben.

Beispiele für Dokumentvarianten sind Rechnungen verschiedener Lieferanten und Kontoauszüge derselben Bank.

Punktmatrixdrucker

Ein Texttyp für die Erkennung, der mit einem Punktmatrixdrucker gedruckten Text darstellt.

dpi

Englische Abkürzung für "Dots per inch" (Punkte pro Zoll). Eine Maßeinheit für die Bildauflösung.

E

Umgebungsvariable

Eine Zeichenkette, die dazu dient, Text wie beispielsweise Systemeinstellungen zu speichern. Umgebungsvariablen dienen dazu, die Verbindungszeichenketten der Datenbank und Variablen zu speichern, die bei der Festlegung der Namen von exportierten Dateien verwendet werden.

Fehler/Warnung

Der Fehler/die Warnung tritt auf, wenn Daten, die aus einem oder mehreren Feldern extrahiert wurden, nicht den Regeln entsprechen, die bei automatischen Überprüfungen angewendet werden oder nicht dem angegebenen Format entsprechen. Es gibt zwei verschiedene Arten von Fehlern und Warnungen:

  • Einzelfeldfehler/Warnung werden durch Regeln und Formate generiert, die sich auf ein Feld auswirken.;
  • Mehrfachfeldfehler/Warnung werden durch Regeln generiert, die sich auf mehrere Felder auswirken.

Erklärender Text

Ein maschinenlesbares Formularelement, das einen beschreibenden Text (Formularname, Feldnamen, Erläuterungen von Feldern usw.) enthält.

Exportieren

Vorgang, bei dem verarbeitete Daten an ein externes Informationssystem oder in eine Datei übertragen werden.

Exportprofil

Ein Satz von Einstellungen, der festlegt, was mit den verarbeiteten Daten geschieht: das Format der Ausgabedateien, den Ausgabepfad, die Exportbedingungen usw.

Externe Datenbank

Eine Textdatei oder eine ODBC-kompatible Datenbank, in der Referenzdaten gespeichert werden. Referenzdaten können die möglichen Werte von erfassten Feldern oder Informationen enthalten, die zum Erfassen von Feldern erforderlich sind.

F

Feld

Ein Dokumentelement, das zum Extrahieren von Daten vorgesehen ist. Felder können einfach (ohne interne Struktur) oder zusammengesetzt sein. Ein zusammengesetztes Feld ist z. B. ein Tabellenfeld, das sowohl als einzelne Zelle als auch als untergeordnetes Feld der Tabelle angesehen werden kann.

Feldbereich

Ein in der Dokumentdefinition hervorgehobener Bildbereich, der für die Datenextraktion vorgesehen ist.

Feldüberprüfung

Ein Überprüfungsmodus, bei dem die erkannten Zeichen im Kontext eines Felds zur Überprüfung übermittelt werden.

Details…

Feld mit mehreren Instanzen

Ein Feld zur Beschreibung mehrerer Objekte desselben Typs (sich wiederholende Objekte). Im Grunde sind diese Objekte als dasselbe Feld anzusehen, da sie dieselben Eigenschaften besitzen. Felder mit mehreren Instanzen sind eine ideale Alternative zum Erstellen mehrerer identischer Felder. Der Export von Feldern mit mehreren Instanzen erfolgt in getrennte Dateien oder Datenbanktabellen.

Feld mit mehreren Bereichen

Ein Feld, das mehrere Bereiche im Bild umfasst. Diese Bereiche können voneinander entfernt und sogar auf verschiedenen Seiten positioniert werden. Die Werte aller Bereiche im gleichen Feld werden kombiniert und zusammen als ein Feld exportiert. Felder mit mehreren Bereichen werden meist für Objekte verwendet, die sich über mehrere Seiten erstrecken (z. B. große Tabellen).

Feld ohne Bereich

Ein in einer Dokumentdefinition erkanntes Feld, das über keinen Bereich im Bild verfügt.

Statisches Formular

Ein Dokument mit statischen Informationsfeldern, deren Formatierung, Anzahl und Layout fest definiert sind und die auch bei unterschiedlichen Dokumentinstanzen unveränderlich bleiben.

Statische Dokumentdefinition

Definition eines Dokuments oder eines Bereichs davon, die für das Verarbeiten statischer Formulare vorgesehen ist. Die Felder in einer statischen Dokumentdefinition haben eine feste Position.

FlexiLayout

Beschreibung der Struktur eines teilweise strukturierten Dokuments. Diese Beschreibung wird mit ABBYY FlexiLayout Studio erstellt und kann nach ABBYY FlexiCapture exportiert werden. Das Dateiformat lautet: *.afl. FlexiLayouts stellen die Anweisungen für das Erkennen und Identifizieren von Feldern in einem flexiblen Formular bereit.

FlexiLayout-Variante

Ein FlexiLayout für eine Dokumentvariante, die entweder speziell für diese Dokumentvariante entwickelt oder mit dieser Dokumentvariante trainiert wurde. Wird in Verbindung mit einem allgemeinen FlexiLayout verwendet.

Flexible Dokumentdefinition

Definition eines Dokuments oder eines Bereichs davon, die für das Verarbeiten teilweise strukturierter Dokumente vorgesehen ist. Die Erstellung erfolgt durch Anfügen eines FlexiLayouts. Die Felder in diesen Dokumentdefinitionen haben keine feste Position. Sie werden stattdessen mithilfe eines FlexiLayouts erkannt.

Formular

Dokument mit einer oder mehreren Seiten, das von einer Person handschriftlich oder mit einem Druckverfahren ausgefüllt werden soll.

Text im Rahmen

Texttyp, der anzeigt, wo der Text durch einen Rahmen begrenzt wird.

Anzeigen...

Text im Rahmen mit Kamm

Texttyp, der anzeigt, wo Text durch einen Rahmen begrenzt wird, dessen unterer Rand wie ein Kamm geformt ist.

Anzeigen...

G

Formular mit grauem Hintergrund

Ein Formular, in dem alle Informationsfelder als weiße Rechtecke auf einem grauen Hintergrund erscheinen, der beim Scannen verschwindet.

Gruppenüberprüfung

Ein Überprüfungsmodus, bei dem als gleich erkannte Zeichen in Gruppen zur Überprüfung übermittelt werden.

Details…

H

Handschrifttext

Ein Texttyp für die Erkennung, der einen handschriftlichen Text darstellt.

Hot Folder

Ein Ordner auf der Festplatte des lokalen oder eines Remotecomputers, der zum Importieren von Bildern verwendet wird. Er wird meist für das regelmäßig wiederholte Laden von Bildern ohne Benutzerbeteiligung verwendet.

I

Kennung

Ein statisches Element, das für die Auswahl einer Dokumentdefinition verwendet wird, wenn mehrere Dokumentdefinitionen über identisch positionierte Anker verfügen. Die Option Für Identifizierung von Dokumentdefinitionen verwenden muss in den Eigenschaften eines solchen statischen Elements aktiviert werden.

Identitätsanbieter

Ein Drittanbietersystem wie Azure AD, OneLogin oder Okta, das Identitätsinformationen verwaltet und Authentifizierungsdienste für seine Clients bereitstellt, sodass Endbenutzer auf alle autorisierten Ressourcen in ihrem lokalen Netzwerk zugreifen können, indem sie ihre Zugangsdaten nur einmal eingeben.

Ignoriertes Zeichen

Ein Zeichen innerhalb von Wörtern (z. B. ein Aufzählungszeichen) oder ein weiches Trennzeichen (Tabulator usw.), das die Software nicht daran hindert, das Wort als erkennbaren Datentyp zu kennzeichnen.

Details…

Bild

Ein elektronisches Abbild einer gescannten Seite eines Papierdokuments.

Bildstörungen entfernen

Das Entfernen von Störungen aus einem Bild. Diese Störungen können beim Scannen auftreten und sollten entfernt werden, um die Datenerkennung zu verbessern. Beim Entfernen von Störungen löscht die Software auch Punkte aus dem Hintergrund sowie Rahmenlinien aus Rasterformularen.

Bildimport

Ein Prozess für das Hinzufügen von Bildern zu einem Stapel für die Verarbeitung. Der Import kann durch Hinzufügen von Bildern aus Dateien, von einem Scanner oder mit Importprofilen ausgeführt werden.

Bilddrehung

Vorgang, bei dem ein Bild um seinen Mittelpunkt gedreht wird.

Importprofil

Eine Kombination von Einstellungen zum Hinzufügen von Bildern zu einem Stapel: Importquelle, Bildverarbeitungsoptionen, Hot Folder-Bereinigungsoptionen usw.

Falsch erkanntes Zeichen

Status, der einem Zeichen bei der Erkennung automatisch zugeordnet wird, wenn es einem bestimmten Grad der Eindeutigkeit nicht entspricht.

Indexfeld

Ein Feld, mit dessen Wert Dokumente für die Sortierung und Suche indiziert werden.

Invertiertes Bild

Ein Bild mit hellem Text auf dunklem Hintergrund.

Rechnung

Ein Dokument, in dem die gelieferten Waren, deren Menge, Preis, Eigenschaften (wie Farbe, Gewicht usw.), die Versandbedingungen und Informationen über die Vertragsparteien aufgeführt sind. Rechnungen können mit einer separaten Lösung verarbeitet werden ABBYY FlexiCapture for Invoices.

ICR, Intelligente Zeichenerkennung

Dieser Begriff bezieht sich auf Technologien oder Systeme für die Massenverarbeitung von Dokumenten, die mit handgeschriebenen Buchstaben und Ziffern ausgefüllt wurden.

K

Schlüsselfeld

Ein Feld, das die automatische Überprüfung der Zusammenstellung von Seiten zu Dokumenten ermöglicht. Die Werte der Schlüsselfelder müssen auf allen Seiten des Dokuments gleich sein.

L

Sprache (Gebietsschema)

Eine Feldeigenschaft, die die Schriftsprache und wichtige regionale Parameter (z. B. Datumsformat oder Adressenschreibweise) festlegt.

Layout

Die Position der Felder in einem Dokumentbild. Layouts können automatisch oder manuell erstellt werden.

Buchstaben in Rahmen

Art der Textmarkierung, bei der jedes Zeichen durch einen Rahmen begrenzt wird. Die Rahmen sind dabei nicht voneinander getrennt.

Anzeigen...

Buchstaben in separaten Rahmen

Art der Textmarkierung, bei der jedes Zeichen durch einen Rahmen begrenzt wird. Die Rahmen sind dabei voneinander getrennt.

Anzeigen...

Buchstaben auf Kamm

Texttyp, bei dem der Text durch einen „Kamm“ begrenzt ist.

Anzeigen...

M

Gedruckter Text

Ein Texttyp für die Erkennung von Text, der mit einer Druckmaschine oder einem Laser- bzw. Ink-Jet-Drucker mit einer Mindestauflösung von 300 dpi gedruckt wurde.

Maschinenlesbares Formular

Ein Formular, das speziell für die automatische Datenerfassung entworfen wurde. Es enthält Arbeitselemente (Anker, Barcodes, Linien usw.), die für die ordnungsgemäße Verarbeitung erforderlich sind.

Feld für die manuelle Eingabe

Ein Dokumentdefinitionsfeld mit nicht erkennbarem Text (z. B. Text mit verschwommenen Buchstaben), der über die Tastatur eingegeben werden muss.

MRC (Mixed Raster Content)

Eine Komprimierungsmethode, die für Bilder verwendet wird, die sowohl Text- als auch Rasterfragmente enthalten. Das Bild wird in Fragmente analysiert und für jedes Fragment ein optimaler Kompressionsalgorithmus ausgewählt. Dieser Ansatz bietet bessere Komprimierungsverhältnisse bei gleichzeitiger Beibehaltung der visuellen Qualität von Bildern.

Konstantschrift

Texttyp, bei dem sich die einzelnen Buchstaben in einem Rahmen mit konstanter Höhe und Breite befinden, der dann beim Scannen verschwindet.

Mehrseitiges Dokument

Ein Dokument, das mehrere Seiten umfasst.

Mehrinstanzenfähigkeit

Eine Funktion, die mehreren unabhängigen Benutzern die Nutzung von ABBYY FlexiCapture ermöglicht. Die Daten einer Instanz sind vollständig von anderen Instanzen isoliert, und das System weist jeder Instanz einen Teil seiner Ressourcen zu.

N

O

OCR (Optische Zeichenerkennung)

Optische Erkennung gedruckter Texte.

OMR (Optische Erkennung von Markierungen)

Mithilfe dieser Technologie kann ABBYY FlexiCapture einfache Markierungen (Häkchen, Kreuze usw.) auf Formularen mit einer hohen Genauigkeit erkennen und gleichzeitig auch zunächst falsch ausgefüllte und später durchgestrichene Markierungen ermitteln.

Operator

Ein Benutzer von ABBYY FlexiCapture, der für die Dokumenterfassung zuständig ist, also das Hinzufügen von Bildern, das Durchführen der Erkennung und Überprüfung und das Exportieren der erkannten Daten.

Rolle 'Operator'

Die Eigenschaft eines Benutzerkontos in ABBYY FlexiCapture, mit der festgelegt wird, auf welche Daten der Benutzer zugreifen kann und welche Aktionen mit diesen Daten durchgeführt werden können.

Überlagerung

Der Vorgang des Kombinierens eines Scans eines ausgefüllten Formulars mit einem Bild eines leeren Beispiels desselben Formulars im Dokumentdefinitionseditor.

P

Seite

Abbild einer Papierseite mit dem Ergebnis der Dokumentverarbeitung.

Seitenlayout

Ein Schema mit den Positionen der Felder auf einem Bild.

Seitenausrichtung

Seitenposition relativ zur Standardausrichtung: von oben nach unten, von links nach rechts. Die Seitenausrichtung kann automatisch bei der Erkennung des Seitenbilds bestimmt werden. Sie können dazu in ABBYY FlexiCapture die möglichen Ausrichtungen angeben.

Bild

Element eines maschinenlesbaren Formulars, das nicht in die Erkennung einbezogen wird, aber für den Export in Form eines Grafikelements (z. B. als Datei) vorgesehen ist.

Bildfeld

Ein Dokumentdefinitionsfeld, das ein Bild enthält.

Vorerkennung

Volltexterkennung von Dokumentenbildern zur Erleichterung der Felderkennung mittels einer Dokumentendefinition.

Rechenleistung

Die durchschnittliche Anzahl von Seiten, Dokumenten oder Stapeln, die in einem bestimmten Zeitraum verarbeitet wurden.

Verarbeitungsphase

Ein Schritt im Workflow, in dem mit einem Dokument oder einem Stapel (entweder automatisch oder von einem Operator) bestimmte Aktionen durchgeführt werden.Einzelheiten finden Sie unter Verarbeitungsschritte und Warteschlangen.

Unzulässiges Zeichen

Ein Zeichen, von dem Sie mit Sicherheit wissen, dass es nicht in den zu erkennenden Daten enthalten sein wird.

Details…

Projekt

In einem Projekt sind verschiedene Dokumentstapel gebündelt und die zur Verarbeitung erforderlichen Einstellungen (Dokumentdefinitionen oder Importprofile) festgelegt.

Q

Warteschlange

Dokumente, die in Tasks und/oder Stapeln zusammengefasst sind und zur Verarbeitung in einem bestimmten Verarbeitungsschritt anstehen.Einzelheiten finden Sie unter Verarbeitungsschritte und Warteschlangen.

R

Rasterformular

Ein Formular, in dem Informationsfelder als weiße Rechtecke auf grauem Hintergrund dargestellt werden, der entweder Rasterlinien oder durch Rasterlinien getrennte Rechtecke enthält.

Rasterlinie

Eine Linie aus Punkten in einheitlichem Abstand.

Erkennung

Vorgang, bei dem Bildelemente bestimmten Zeichen zugeordnet werden.

Erkennung

Sprache, auf der die Erkennung von ABBYY FlexiCapture beruht.

Referenzlayout

Ein vom Benutzer erstelltes Layout, das als Referenz für automatisch erstellte Layouts verwendet wird. Dieser Vergleich dient zur Beurteilung, wie gut das Programm Feldbereiche erkennt.

Auflösung

Bildparameter. Die Auflösung wird in dpi (Dots Per Inch, Punkten pro Zoll) angegeben.

Regelbasierte Validierung

Vorgang, bei dem erkannte Daten anhand vordefinierter Regeln automatisch überprüft werden. Siehe Regelbasierte Validierung.

Regeln

Bedingungen für Datenfelder, die vom Programm automatisch überprüft werden.

S

Scannen

Vorgang, bei dem ein Papierformular mithilfe eines Scanners in ein elektronisches Bild umgewandelt wird.

Bereich

Ein logisch eindeutiger Teil eines Dokuments, der eine Reihe extrahierbarer Felder enthält. Abschnitte werden während des Erkennungsprozesses für verschiedene Zwecke verwendet, z. B. zum Zusammenstellen von Dokumenten aus Seiten. Abschnitte können eine einzelne Seite oder mehrere Seiten umfassen und festgelegt oder flexibel sein.

Teilweise strukturiertes Dokument

Ein Dokument mit einer Reihe von Informationsfeldern, deren Design, Anzahl und Layout sich bei verschiedenen Instanzen des Dokuments erheblich unterscheiden können. Siehe Unterstützte Dokumenttypen in ABBYY FlexiCapture.

Trennzeichen

Element eines maschinenlesbaren Formulars, das durch eine vertikale oder horizontale Linie dargestellt wird.

Dienstfeld

Im Dokumentenbild ist kein Bereich für ein Feld enthalten. Die Werte der Dienstfelder werden automatisch auf der Basis von Daten der Quelle bestimmt, die in ihren Eigenschaften angegeben ist.

Zulässiger Zeichensatz

Eine Gruppe von Zeichen, die im zu erkennenden Datentyp vorkommt.

Details…

Einfacher Text

Eine Form der Textmarkierung, bei der der Text ohne Trennzeichen in einen Block eingefügt wird.

Datenerfassung in einem Durchgang

Automatisches Extrahieren von Daten aus analogen (gedruckten) und digitalen Dokumenten (gescannte Bilder).

Dokumenterfassung in einem Durchgang

Die automatisierte Konvertierung von Papierdokumenten in ein elektronisches Format.

SLA (Dienstleistungsvereinbarung)

Eine Vereinbarung über die Bereitstellung von IT-Diensten. In ABBYY FlexiCapture 12 regelt eine SLA-Vereinbarung die Fristen für die Stapelverarbeitung.

Statische Elemente

Nicht erkennbare Zeichen, die der Zuordnung und Identifizierung der Dokumentdefinition dienen. Solche Elemente sind: Anker, Ankertext, Trennzeichen, Ankerbarcodes.

Bereich für Zusammenfassung

Der Bereich für Zusammenfassung ist ein Bereich der Dokumentdefinition, in der alle wesentlichen Felder einer Dokumentenmappe angezeigt werden. Dies erleichtert den Operatoren das Überprüfen von Dokumenten in einem Satz erheblich, da sie alle Fehler und Daten mit geringer Erkennungszuverlässigkeit an einem Ort anzeigen und nur die zu überprüfenden Dokumente öffnen können, anstatt jedes Dokument zu öffnen.

T

Tabelle

Daten, die in einem (nicht notwendigerweise sichtbaren) zweidimensionalen Raster angeordnet sind. Die Software verarbeitet Tabellen, die aus Spalten mit gleichen Datentypen und sich wiederholenden Zeilen bestehen.

Tabellenfeld

Ein Dokumentdefinitionsfeld, das eine Tabelle enthält. Dabei handelt es sich um ein zusammengesetztes Feld, bei dem jede Tabellenspalte einen Satz von Feldern desselben Typs darstellt: Text, Auswahlfelder, Barcodes oder Bilder.

Task

Eine Gruppe von Dokumenten aus demselben Stapel , die zusammen verarbeitet werden sollen. Abhängig von den Projekteinstellungen und von der Verarbeitungsphase kann ein Task eine unterschiedliche Anzahl von Dokumenten enthalten. Wenn in einer Verarbeitungsphase ein Stapel komplett verarbeitet werden muss, ist der gesamte Stapel in den Task eingeschlossen. Wenn Überprüfungstasks automatisch erstellt werden, enthält jeder Task 10 Dokumente (wenn ein Stapel weniger als 10 nicht überprüfte Dokumente enthält, werden alle als ein Task verarbeitet).

Instanz

Eine isolierte Instanz von ABBYY FlexiCapture, die unabhängig von anderen Benutzern verwendet werden kann.

Teststapel

Dokumentstapel, die für das Testen und Konfigurieren von Dokumentdefinitionen vorgesehen sind. Für die Verarbeitung von Teststapeln werden lokale Kopien von Dokumentstapeln verwendet.

Textfeld

Element eines maschinenlesbaren Formulars, das beim Ausfüllen dieses Formulars der Eingabe von Text dient.

Textfeldmarkierung

Ein Grafikelement, das ein Textfeld begrenzt, z. B. Rahmen, Kamm oder Linie.

Textmarkierung

Das Layout eines Seitenbereichs, der für die Texteingabe vorgesehen ist.

Textausrichtung

Ausrichtung des Textes in einem Feld in Bezug auf die Seite.

Texterkennung (OCR, ICR)

Umwandlung eines grafischen Bildes in Text.

Textbeispiel

Eine Datei mit Beispielen aller alphabetischen Zeichen.

Training [Document Definition]

Eine Funktion in ABBYY FlexiCapture for Invoices, mit der Benutzer dem Programm vermitteln können, wie Informationen aus bestimmten Rechnungstypen zu erfassen sind. Das Training verbessert die Qualität der Datenerfassung und kann entweder bei der Einrichtung des Programms oder während der Verarbeitung erfolgen.

Trainingsstapel

Ein Dokumentstapel für das Trainieren und Testen einer Dokumentdefinition für eine bestimmte Dokumentvariante. Das Training einer Dokumentdefinition mit einem Trainingsstapel erstellt eine FlexiLayout-Variante. Für weitere Informationen siehe auch Dokumentstapel, Dokumentvariante, FlexiLayout-Variante.

Schreibmaschine

Ein Texttyp für die Erkennung, der mit einer Schreibmaschine geschriebenen Text darstellt.

U

Unterstrichener Text

Art der Hervorhebung, bei der Zeichen unterstrichen sind.

Anzeigen...

Benutzerwörterbuch

Ein Hilfswörterbuch, das der Benutzer erstellt und das Wörter enthält, die nicht in den integrierten Wörterbüchern enthalten sind. Benutzerwörterbücher können die integrierten Wörterbücher ergänzen, um die Qualität der Datenerfassung zu verbessern. Ein typisches Benutzerwörterbuch enthält Fachtermini, Abkürzungen, Firmennamen usw.

V

Lieferant

Eine juristische oder natürliche Person, die Waren oder Dienstleistungen verkauft. Der Lieferant stellt für die Waren und Dienstleistungen Rechnungen aus. Die Rechnungsinformationen können mithilfe von ABBYY FlexiCapture for Invoices erfasst werden.

Überprüfung

Bei der Überprüfung wird festgestellt, ob die Daten erkannt wurden, die Seiten korrekt in Dokumente zusammengefasst wurden und die Regeln keine Fehler zurückgegeben haben. Die Überprüfung wird auf der Datenüberprüfungsstation (wo die Erkennungsgenauigkeit überprüft wird) und auf der Überprüfungsstation (wo alle Überprüfungstypen durchgeführt werden) durchgeführt.

W

Arbeitsstapel

Dokumentstapel für die Dateneingabe. Für die Verarbeitung von Arbeitsstapeln werden nur veröffentliche Dokumentdefinitionen verwendet.

Schreibstil

Schreibweise, die für eine spezielle Gruppe kennzeichnend ist. Ein Beispiel ist die amerikanische Schreibweise von Zahlen.

Details…

X

XFD

Abkürzung für XML-Formulardefinition (*.xfd). Hierbei handelt es sich um ein spezielles Dateiformat für Formulare, die mit ABBYY FormDesigner erstellt wurden. Mithilfe von XFD-Dateien können in ABBYY FlexiCapture Dokumentdefinitionen erstellt werden.

10.11.2020 12:08:03


Please leave your feedback about this article