Erstellen eines Skripts zur Dokumententrennung

ABBYY FineReader Server 14 ermöglicht Ihnen, die Trennung von Dokumenten mithilfe eines Skripts zu konfigurieren. Zuerst werden die Trennungsmarkierungen in Übereinstimmung mit der ausgewählten Methode hinzugefügt, dann wird das Skript ausgelöst und diese Markierungen werden an das Skript weitergegeben. Daher kann das Skript zum Einstellen oder Erweitern der ausgewählten Teilungsregel mithilfe von erkanntem Text und Strichcodes verwendet werden.

Das Skript wird für jede erkannte Seite separat ausgeführt. Daher kann eine Dokumententrennung nicht als Ergebnis eines Vergleichs von zwei Seiten erfolgen. Mithilfe des Skripts zur Dokumententrennung können Sie den Beginn eines neuen Dokuments auf der Grundlage des Seiteninhalts und der Seiteneigenschaften festlegen, die Seite zum Löschen kennzeichnen (z. B. wenn es sich um eine Trennungsseite oder eine leere Seite handelt) oder den Job verwerfen.

Wichtig! Skripte zur Dokumententrennung werden in der Verarbeitungsstation ausgelöst. Damit das Skript mit den freigegebenen Ressourcen richtig funktioniert, müssen Sie die Verarbeitungsstationen daher unter einem Benutzerkonto ausführen, das die erforderlichen Berechtigungen für den Zugriff auf diese Ressourcen hat.

Führen Sie folgende Schritte aus, um das Skript zu erstellen und einzusetzen:

  1. Öffnen Sie die Registerkarte Dokumententrennung im Dialogfeld Workflow-Eigenschaften.
  2. Wählen Sie eine der integrierten Methoden für die Dokumententrennung (der Standardwert ist Ein Dokument für jeden Job erstellen) und klicken Sie auf Skript....
  3. Wählen Sie im daraufhin angezeigten Dialogfeld Skripteditor  die Skriptsprache aus und geben Sie den Skripttext ein. Die Referenz "this" oder "Me" bezieht sich auf das Objekt RecognizedPage.
  4. Um das Skript zu überprüfen, klicken Sie auf die Schaltfläche Überprüfen. Um das Skript zu speichern, klicken Sie auf OK.

Wichtig! Wenn Sie mehrseitige Dokumente verarbeiten, teilt das Programm die einzelnen Dokumente in mehrere Teile auf, die einzeln jeweils von einem Prozessorkern verarbeitet werden. Die Anzahl der Seiten in einem Teil wird durch das Attribut PagesSlice festgelegt (die Standardeinstellung ist 25).

  • Wenn Sie die Workflow-Eigenschaften bearbeiten oder Einstellungen aus einer XML-Datei laden, sodass PageSlice=25 ist und dann dem Workflow ein Skript für die Dokumententrennung hinzufügen, werden die Dokumente nicht aufgeteilt und das Attribut PagesSlice wird automatisch auf -1 festgelegt. Entspricht der Wert des Attributs PagesSlice einem anderen Wert als 25, bleibt dieser unverändert.
  • Wenn Sie die Workflow-Eigenschaften bearbeiten oder Einstellungen aus einer XML-Datei laden, sodass PageSlice=-1 und es wurde dem Workflow kein Skript für die Dokumententrennung hinzugefügt, wird das Attribut PagesSlice automatisch festgelegt und die Dokumente werden in Teile von 25 Seiten aufgeteilt.

Informationen zur Verwendung von Skripten finden Sie unter Verwenden von Skripten in ABBYY FineReader Server.

Beispiel

Das unten dargestellte Beispielskript ist in JScript geschrieben und dient der Verteilung erkannter Seiten auf die Dokumente in drei Gruppen (Artikel, Lebensläufe, Broschüren) mithilfe von Trennungsseiten. Entspricht der Text einer erkannten Seite dem festgelegten Text, wird der relevante benutzerdefinierte Test dieser Seite zugeordnet (die Eigenschaft CustomText des Objekts RecognizedPage ), die Seite wird als erste Seite im Dokument markiert (die Eigenschaft IsStartingPage ) und zum Löschen markiert (die Eigenschaft IsForDeletion ). Daher trennt die Ausführung des Skripts die Dokumente in drei Gruppen und löscht die Trennungsseiten.

Hinweis. Dieses Skript wird bei einem Scripting Demo-Szenario zur Demoverarbeitung verwendet, dessen Einstellungen in ScriptingDemoWorkflow.xml im folgenden Ordner enthalten ist: Beispiele (Start > Programe> ABBYY FineReader Server 14 > Beispiele).

var pageText = Text;
var isArticle = pageText == "Separator sheet Document type: article";
var isResume = pageText == "Separator sheet Document type: resume";
var isBrochure = pageText == "Separator sheet Document type: brochure";
if( isArticle ) {
CustomText = "Article";
} else if( isResume ) {
CustomText = "Resume";
} else if( isBrochure ) {
CustomText = "Brochure";
}
if( isArticle || isResume || isBrochure ) {
IsStartingPage = true;
IsForDeletion = true;
}

Weitere Informationen

Verwenden von Skripten in ABBYY FineReader Server

26.03.2024 13:49:48

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.