Registerkarte "2. Verarbeitung"  des Dialogfelds "Workflow-Eigenschaften"

Die Registerkarte 2. Verarbeitung umfasst verschiedene Erkennungsoptionen.

Name der Option Beschreibung der Option
Dokumentsprachen Gibt die Erkennungssprachen an. Die Sprachen sind alphabetisch sortiert und in zwei Gruppen aufgeteilt: Die erste Gruppe enthält Sprachen mit vollständiger Wörterbuchunterstützung, die zweite Gruppe enthält Sprachen ohne Wörterbuchunterstützung. Siehe Liste der Erkennungssprachen.
Sprache automatisch auswählen

Die Dokumentsprache wird automatisch anhand der in der Liste Dokumentsprachen ausgewählten Sprachen erkannt.  

Hinweis. Die Auswahl dieser Option kann ABBYY FineReader Server bei der Verarbeitung von Texten in nicht-europäischen Sprachen verlangsamen.

OCR optimieren für Gibt den Modus an, mit dem die Erkennung nach Qualität oder Geschwindigkeit optimiert wird.
Benutzerdefiniertes Wörterbuch verwenden Gibt den Pfad eines benutzerdefinierten Wörterbuchs an, das bei der Erkennung verwendet werden soll. Ein benutzerdefiniertes Wörterbuch ist eine Textdatei in UTF-16-Kodierung, in der die Wörter als Liste mit einem Wort pro Zeile enthalten sind.
Verarbeitungsmodus

Gibt den Erkennungsmodus an:

  • Gesamter Text (Text aus Bildern extrahieren)


    Das Programm kann sämtliche gefundene Texte im Dokument erkennen, einschließlich von Text in Bildbereichen.
  • Text und Bilder (Text nicht aus Bildern extrahieren)
    Sämtliche Texte werden vom Programm erkannt, mit Ausnahme von Text in den Bildbereichen.
  • Nur Barcodes
    Wählen Sie diesen Modus aus, wenn nur Strichcodewerte aus Dokumenten extrahiert werden sollen.
    • Hinweis. Mit dieser Option werden Seiten ohne Strichcodes wie leere Seiten behandelt.
    • Hinweis. Strichcodes des Typs Code 39 ohne Sternchen können in diesem Modus nicht erkannt werden.

Erweiterte Einstellungen...

(Schaltfläche)

Öffnet das Dialogfeld Erweiterte Verarbeitungseinstellungen.
PDF-Verarbeitungsmodus
  • Autom.
    Die PDF-Eingabedokumente werden analysiert und (i) Dokumente ohne Textebene und Dokumente mit gescanntem oder erkanntem Text einem OCR unterzogen, (ii) Dokumente mit einer Textebene aus einer Office-Datei im "Istzustand" exportiert.
  • Immer OCR verwenden
    PDF-Eingabedokumente werden unabhängig von der Verfügbarkeit einer Textebene einem OCR unterzogen.
  • Immer Text in PDF-Datei verwenden
    PDF-Eingabedokumente ohne Textebene werden einem OCR unterzogen. Dokumente mit einer Textebene werden im "Istzustand" exportiert.
Originalbilder und Kommentare in gescannter PDF erhalten

Die originale Bildebene, Notizen und Kommentare werden in den Ausgabedateien beibehalten.

Hinweis. Die originale Bildebene kann nur bei JPEG-Dateien erhalten bleiben.

Nehmen Sie an PDF-Dateien mit digitalen Unterschriften keine Änderungen vor Der Text in PDF-Dokumenten wird einem OCR unterzogen, aber die Originaldokumente bleiben intakt und deren digitalen Signaturen werden beibehalten.
Verarbeitungsmodus für Office-Dokumente Sie können in der Dropdownliste eine Microsoft Office- oder LibreOffice-Anwendung für die Verarbeitung von Office-Dokumenten auswählen (z. B. Dateien des Typs *.doc, *.docx, *.odt, *.html, *.htm, *.txt, *.rtf; *.xls, *.xlsx, *.ods; *.ppt, *.pptx, und *.odp).

Weitere Informationen

Dialogfeld "Workflow-Eigenschaften"

26.03.2024 13:49:48

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.