-
Info
- Neue Funktionen in ABBYY FlexiCapture 12
- Unterstützte Dokumenttypen in ABBYY FlexiCapture
- Kurzbeschreibung der Dokumentverarbeitung mit ABBYY FlexiCapture
- Installieren und Ausführen des Programms
- Architektur von ABBYY FlexiCapture
-
Konfigurieren des Programms
- Konfiguration von ABBYY FlexiCapture
- Mehrinstanzenfähigkeit
-
Erstellen eines Projekts
- Projekteigenschaften
- Umgebungsvariablen
- Bildimport
- Stapeltypen
- Workflow-Konfiguration
- Extras
- Standard-Stapelpriorität
- SLA-Einstellungen
- Benutzerdefinierte Operatorrollen
- Registrierungsparameter
- Hochladen eines Projekts zum Anwendungsserver
- Projekt testen
- Designeinstellungen
- Qualität der angezeigten Bilder
-
Dokumentdefinitionen
- Erstellen von statische Dokumentdefinitionen
- Erstellen einer Dokumentdefinition zum Verarbeiten nicht strukturierter und flexibler Dokumente
- Document Definitions without automatic fields extraction
- Dokumentenmappen
-
Dokumentdefinitionsfelder
- Texteingabefeld
- Checkmarks
- Gruppen von Auswahlfeldern
- Barcode
- Bilder
- Tabellen
- Feldgruppe
- Dienstfeld
- Indexfelder
- Link zu vorhandenem Feld
- Felder ohne Bereich
- Erstellen eines Felds mit einem nicht rechteckigen Bereich
- Felder mit mehreren Instanzen
- Felder mit mehreren Bereichen
- Ändern eines Feldnamens
- Kopieren, Verschieben und Löschen von Feldern
- Ausschließen eines Bereichs von der Erkennung
- Dokumentdefinitionsassistent
- Bearbeitung und Veröffentlichung einer Dokumentdefinition
- Zusammenstellung mehrseitiger Dokumente
- Eigenschaften der Dokumentdefinition
- Eigenschaften eines Dokumentdefinitionsbereichs
- Regelbasierte Validierung
- Konfigurieren des Datenexports
- Konfigurieren der Datendarstellung im Dokumentfenster
- Testen von Dokumentdefinitionen
- Lokalisierung einer Dokumentdefinition
-
Klassifizierung
- Klassifizierungsszenarien
- Klassifizierungsprofile
- Aufruf-Genauigkeit-Balance
-
Erstellen eines Klassifizierers
- Einrichtung von Klassifizierern
- Einrichten Ihrer Klassifizierer und Laden von Bildern
- Trainings-Klassifizierer
- Analysis of classification results
- Improving your classifier
- Exportieren und Importieren von Klassifizierern
- Zuordnung von Klassen zu Dokumentdefinitionsbereichen
- Klassifizierung anhand einer Unternehmensdatenbank_2
- Training für Feldextrahierung
- Arbeiten mit einem konfigurierten Projekt
-
ABBYY FlexiCapture für Rechnungen
- Funktionen von ABBYY FlexiCapture for Invoices
- Erfassen von Rechnungen
-
Einrichtung eines Projekts zur Rechnungserfassung
- Land- und Spracheinstellungen
- Verbindung mit Datenbanken für Lieferanten und Geschäftseinheiten
- Einstellungen für den Datenexport
- Der Status von Dokumenten in Projekten von ABBYY FlexiCapture for Invoices
- ABBYY FlexiCapture for Invoices Trainieren
- Regeln
- Erfassung zusätzlicher Rechnungsfelder
- Kontrolle von Rechnungspositionen
- Zusätzliche Programmfunktionen für Operatoren aktivieren
- Verwenden mehrerer Dokumentdefinitionen
- Einstellungen der Rechnungsverarbeitung in XML-Dateien bearbeiten
- Aktualisierung der Dokumentdefinition für Rechnungen
- Spezifikationen
- Capturing receipts
- Capturing purchase orders
-
Verarbeiten nicht strukturierter Dokumente mit NLP
- Installation des NLP-Moduls
- Erstellen einer neuen Dokumentdefinition
- Erstellen von NLP-Modellen
- Trainieren Ihrer NLP-Modelle
- NLP model training based on feedback from verification operators
- Laden eines vorhandenen NLP-Modells
- In welchen Fällen Sie Extraktionsskripte verwendet sollten
- Bekannte Einschränkungen
- Glossar
- Benutzeroberfläche von ABBYY FlexiCapture
-
Anhang
-
Verwenden von Skripten in ABBYY FlexiCapture
- Besonderheiten von in .Net-Sprachen geschriebenen Skripten
- Externe Assemblys
- Objektmodell
-
Skripte für die benutzerdefinierte Anpassung der Verarbeitungsphasen
-
Skripttypen
- Skriptregel
- Autokorrekturskript
- Exportskript
- Benutzerskript (benutzerdefinierte Aktion)
- Skript für Dokumentzusammenstellung
- Benutzerdefiniertes Erkennungsskript
- Phasenregel
- Verarbeitungsskripte
- Aktualisierungsskript für Datensätze
- Validierungsskripte für Datensätze
- Skript für die Dokumentklassifizierung
-
Event-Handler
- Stapel erstellt
- Stapel gelöscht
- Stapelparameteränderung
- Änderung der Stapelstruktur (Seite hinzugefügt/Seite gelöscht/Dokument hinzugefügt/Dokument gelöscht)
- Seiten verschoben
- Stapel geöffnet/geschlossen
- Stapelintegritätsprüfung
- Dokumentparameter geändert
- Dokumentstatus geändert
- Export abgeschlossen
- Skript, das nach Regelprüfungen ausgeführt wird
- Vor der Zuordnung
- Feldüberprüfungsanforderung
-
Objekte
- IActionResult
- IAssemblingError
- IAssemblingErrors
- IBatch
- IBatchCheckResults
- IBatchItem
- IBatchItems
- IBatchTypeClassifier
- IBatchTypeClassifierResult
- IBinarizationParams
- IBoxedBoolean
- ICharacterParams
- ICharactersParams
- ICheckmarkGroupValue
- ICheckmarkValue
- IDataSet
- IDataSetQuery
- IDataSetRecord
- IDocument
- IDocuments
- IDocumentExportResults
- IDocumentsExportResults
- IDocumentDefinitionInfo
- IDocumentDefinitionInfoArray
- IEditablePictureObject
- IExportFieldsToRedact
- IExportImageSavingOptions
- IField
- IFieldRegion
- IFieldRegions
- IFields
- IFlexiCaptureTools
- ILocalContrastParams
- IMatchedSectionInfo
- IMatchingInfo
- IPage
- IPageClassificationResult
- IPages
- IPictureObject
- IPictureObjectsInfo
- IPrincipal
- IPrincipals
- IProcessingCallback
- IProject
- IProperties
- IProperty
- IPropertyModificationInfo
- IRecordCheckResult
- IRecordset
- IRect
- IRects
- IRoutingRuleResult
- IRuleContext
- IRuleError
- IRuleErrors
- IRuleTag
- IRuleTags
- IScriptBinaryAttributes
- IScriptDefinitionContext
- ISectionDefinitionInfo
- ISectionDefinitionInfoArray
- IShadowsHighlightsParams
- IStageInfo
- IUserAttachment
- IUserAttachments
- IUserSessionInfo
- IValue
- IVARIANTArray
- TAssemlingErrorType
- TBatchItemType
- TColorToFilter
- TExportFieldType
- TExportType
- TImageCompressionType
- TPageClassificationType
- TPdfAVersion
- TPdfDocumentInfoType
- TPdfTextSearchAreaType
- TPrincipalType
- TProcessingPriority
- TPropertyType
- TRuleErrorType
- TStateType
- Beispielskripte
- Interne Namen der Erkennungssprachen
-
Skripttypen
-
Skripts für die Verarbeitung von Schnittstellenevents
-
Event-Handler
- Bei Aktivierung des Dokuments
- Bei Schließen des Projekts
- Bei Aktivierung des Dokuments
- Bei Steuerelement des Feldes aktivieren
- Bei Rückgabe von Task
- Bei Benutzerbefehl
- Bei Steuerlement des Felds deaktivieren
- Bei Schließen des Dokuments
- Bei Schließen des Tasks
- Bei Schließen des Projekts
- Bei Bereichsänderung
- Bei Änderung des Taskfenstermodus
- Bei Öffnen des Dokuments
- Bei Taskfenster erstellen
- Bei Taskablehnung
- Bei Bereichssteuerung zeichnen
- Bei Senden des Tasks zur Phase
- Bei Textfeld Überprüfung
-
Objekte
- IBoolean
- IBoxedFieldControl
- IDocumentEditor
- IDocumentItem
- IDocumentItems
- IDocumentsCollection
- IDocumentsWindow
- IDrawContext
- IErrorControl
- IErrorControls
- IErrorsWindow
- IFieldControl
- IFieldRegionControl
- IFieldRegionControls
- IFormWindow
- IImageWindow
- IMainMenu
- IMainWindow
- IMenu
- IMenuItem
- IPageControl
- IPageItem
- IPageItems
- IPagesCollection
- IPoint
- ISelection
- IShellRational
- IShellRect
- IShellRects
- ITaskWindow
- ITextEditor
- IToolbar
- IToolbarButton
- IToolbars
- TCommandBarType
- TCommandID
- TDockingType
- TDocumentState
- TErrorType
- TSelectionType
- TTaskWindowMode
- TTextSize
- TUserRole
- TWorkWindowType
-
Event-Handler
- Benutzerskript für Web-Überprüfungsstation
- Erstellen von maschinenlesbaren Formularen
-
Tastenkombinationen
- Tastenkombinationen für die Projektkonfigurationsstation
- Tastenkombinationen für die Überprüfungsstation
- Tastaturbefehle im Hauptfenster der Datenverifizierungsstation
- Tastenkombinationen für den Dokumentdefinitionseditor
- Tastaturbefehle im Fenster für die Gruppenüberprüfung
- Tastaturbefehle im Fenster für die Feldüberprüfung
- Tastenkombinationen
- Zusätzliche Optionen
- Description of Processing Server commands
- ABBYY FlexiCapture-Beispielprojekte
- Unterstützte Erkennungssprachen
- Supported classifier languages
- Schriftarten für die korrekte Darstellung von Zeichen
- Unterstützte Texttypen
- Unterstützte Barcodetypen
- Unterstützte Eingabeformate
- PDF-Dateien werden verarbeitet
- Exportdateiformate
- Datumsformate
- Alphabet in regulären Ausdrücken
- Patente
- Drittpartei-Technologien
- Glossar
- Technischer Support
- Informationen zum Kauf von ABBYY FlexiCapture
- Endbenutzer-Lizenzvertrag (EULA)
-
Verwenden von Skripten in ABBYY FlexiCapture
Verarbeiten nicht strukturierter Dokumente mit NLP
Die Natürliche Sprachverarbeitung (NLP) ist ein Unterfeld künstlicher Intelligenz und mathematischer Linguistik. NLP befasst sich mit Computeranalyse und Synthese von natürlichen Sprachen. Eine mögliche praktische Anwendung von NLP ist die Extraktion aussagekräftiger Daten aus Text.
Wie ein Dokument verarbeitet wird, hängt von seiner Struktur ab. Für unsere Zwecke können wir drei Arten von Dokumenten unterscheiden: strukturierte, teilweise strukturierte und nicht strukturierte Dokumente.
- Strukturierte Dokumente enthalten eine Reihe klar definierter Datenfelder, deren Design, Anzahl und Platzierung sich nicht von einem Dokument zum anderen ändern. Beispiele für strukturierte Dokumente sind Formulare, Fragebögen und Anträge.
- Teilweise strukturierte Dokumente enthalten eine Reihe von Datenfeldern, deren Design, Anzahl und Platzierung sich von einem Dokument zum anderen wesentlich unterscheiden kann. Sie werden manchmal auch als "flexible Dokumente" bezeichnet. Ein Beispiel für teilweise strukturierte Dokumente sind Rechnungen, bei denen die Anzahl der Einträge und Formatierungen häufig vom ausstellenden Unternehmen abhängt.
- Nicht strukturierte Dokumente enthalten Informationen, die in keiner Weise strukturiert sind. Sie enthalten außerdem keine expliziten Datenfelder. Beispiele für nicht strukturierte Dokumente sind Verträge, Briefe und Bestellungen.
Weitere Informationen zu den Dokumenttypen finden Sie unter Unterstützte Dokumenttypen in ABBYY FlexiCapture.
Für die Verarbeitung nicht strukturierter Dokumente sollte die NLP-Technologie verwendet werden. Mit NLP können beispielsweise die folgenden Arten von Daten aus einem Vertrag extrahiert werden: Referenznummern, Namen der Parteien, wichtige Daten (Unterzeichnungsdatum, Datum des Inkrafttretens, Laufzeit und Kündigungsdatum), Vertragspreis, Gebühren, Zahlungsbedingungen und so weiter.
Um Informationen aus den Tabellen zu extrahieren, strukturierte und teilweise strukturierte Dokumente, sollten andere Methoden verwendet werden (wie z. B. FlexiLayouts).
Extrahieren von Informationen aus Texten
Die Softwareprodukte von ABBYY verwenden NLP-Modelle für Extrahieren von Informationen aus nicht strukturierten Texten. Ein NLP-Modell teilt dem Programm mit, welche Einheiten aus einem Dokument extrahiert werden sollen. Wenn Sie ein NLP-Modell an Beispieldokumenten trainieren, werden der Themenbereich Ihrer Texte und der entsprechende Extraktionsalgorithmus festgelegt, damit die benötigten Informationen effizienter extrahiert werden können. Der zum Erstellen eines NLP-Modells erforderliche Aufwand hängt von der Vielfalt Ihrer Dokumente, vom Kontext, der dem Programm zur Verfügung steht, und der Komplexität und Menge der Informationen ab, die Sie extrahieren müssen.
Das Extrahieren von Daten aus nicht strukturiertem Text erfordert viel Rechenleistung. Die Analyse umfangreicher Texte erfordert mehr Zeit.
Die erforderlichen Informationen befinden sich jedoch häufig auf einer bestimmten Seite oder in einem bestimmten Absatz eines sehr großen Textes. Der Prozess, solche nützlichen Textteile aufzufinden, wird Segmentierung genannt. Dieser Prozess erfordert wesentlich weniger Zeit und Rechenressourcen, als das Extrahieren von Einheiten, daher sollten Sie manchmal ein Dokument segmentieren, bevor Sie die Informationen daraus extrahieren. Weitere Informationen zur Identifizierung nützlicher Segmente finden Sie unter Erstellen eines NLP-Segmentierungsmodells.
Um mit NLP nicht strukturierte Dokumente zu verarbeiten, gehen Sie folgendermaßen vor:
- Installieren Sie das NLP-Modul.
- Erstellen Sie eine Dokumentdefinition.
- Erstellen und trainieren Sie ein NLP-Modell.
- Alternativ laden Sie ein vorhandenes NLP-Modell in Ihre Dokumentdefinition.
1/14/2021 2:17:18 PM