Verarbeitung von Office-Dokumenten

ABBYY FineReader Server ermöglicht Ihnen die Verarbeitung von Office-Dokumenten (wie z. B. DOC, DOCX, XLS, XLSX, PPT, PPTX usw.) im selben Workflow wie auch Bilddateien.

Verarbeitung von Office-Dokumenten in ABBYY FineReader Server

Standardmäßig werden Office-Dokumente von der Komponente Support für Office-Dateiformate verarbeitet, die gemeinsam mit der Komponente Verarbeitungsstation installiert werden kann.

In ABBYY FineReader Server können Sie Office-Dokumente auch mit einem Skript verarbeiten, mit dem sie zu Bilddateien konvertiert werden oder die API verwenden .

Verarbeiten von Office-Dokumenten mit Microsoft Office oder LibreOffice

Für optimale Ergebnisse verarbeiten Sie Office-Dokumente mithilfe einer Anwendung von Drittanbietern, die auf demselben Computer installiert ist wie ABBYY FineReader Server. ABBYY FineReader Server unterstützt eine Integration in Microsoft Office 2013 oder höher und LibreOffice 4 oder höher.

Hinweis. Um eine korrekte Integration in ABBYY FineReader Server zu gewährleisten, installieren Sie LibreOffice in den Standardorder, der vom LibreOffice-Installationsprogramm auf der Systemfestplatte verwendet wird.

Hinweis. In manchen Fällen kann die Konvertierung von Office-Dokumenten aufgrund von Problemen mit bestimmten Versionen von LibreOffice fehlschlagen (weitere Informationen finden Sie in der ABBYY-Wissensdatenbank).

Konfiguration der Verarbeitung

Für die Konfiguration der Verarbeitung von Office-Dokumenten in ABBYY FineReader Server führen Sie die folgenden Schritte durch:

  1. Wählen Sie Vorverarbeitung oder Verarbeitung und Vorverarbeitungsrolle für eine oder mehrere Verarbeitungsstationen. Microsoft Office oder LibreOffice muss auf Computern installiert sein, auf denen Verarbeitungsstationen mit diesen Rollen ausgeführt werden.
  2. Öffnen Sie die 2. VerarbeitungRegisterkarte im Workflow-Eigenschaften Dialogfeld. Wählen Sie aus der Dropdownliste Verarbeitungsmodus für Office-Dokumente das Programm MS Office oder LibreOffice für das Öffnen von Office-Dokumenten.
  3. Geben Sie die Benutzerdaten für das Benutzerkonto ein (Benutzername und Passwort), unter dem das Programm ausgeführt wird.
    • Wird der Dienst FineReader Server-Verarbeitungsstation unter dem lokalen Systemkonto ausgeführt und Microsoft Office 2013, 2016 oder 2019 wird verwendet, müssen Benutzername und Passwort des Benutzerkontos angegeben werden.
    • Wird der Dienst FineReader Server-Verarbeitungsstation unter einem Benutzerkonto ausgeführt und Microsoft Office 2013 wird verwendet, sind Benutzername und Passwort nicht erforderlich.
    • Wird der Dienst FineReader Server-Verarbeitungsstation unter einem Benutzerkonto ausgeführt und Microsoft Office 2016 oder 2019 wird verwendet, starten Sie den Dienst unter dem lokalen Systemkonto neu und geben Benutzername und Passwort des Benutzerkontos ein.

Hinweis. Dateien der folgenden Formate werden standardmäßig verarbeitet: DOC, DOCX, ODT, HTM, HTML, TXT, RTF, XLS, XLSX, ODS, PPT, PPTX, ODP.

Hinweis. Die Liste der unterstützten Formate kann geändert werden. Um die Liste zu ändern, muss in der Konfigurationsdatei (% PROGRAMDATA% \ ABBYY FineReader Server 14\ Configuration.xml) eine Reihe von Dateierweiterungen angegeben werden, die für das Öffnen von Office-Dokumenten erforderlich sind (siehe Attribute WordFilesMask, ExcelFilesMask, PowerPointFilesMask, VisioFilesMask des Tags \OnFileReceivedCustomOffice\ CustomOfficeConversionParams\CustomOfficeApplications). Wenn Sie beispielsweise WordFilesMask="*.doc;*.docx;", angeben, werden die Dateien DOC und DOCX mit Microsoft Office Word oder LibreOffice Writer geöffnet (je nachdem, welches Programm Sie ausgewählt haben), aber ein Programm für die Verarbeitung von RTF-Dateien wird dann nicht gefunden.

Hinweis. Office-Dokumente werden vom Programm eines Drittanbieters in folgenden Fällen nicht gelesen:

  • Das Programm eines Drittanbieters ist nicht lizenziert oder seine Lizenz wurde nicht aktiviert.
  • Das Programm des Drittanbieters ist nicht die Standardanwendung für das Öffnen von Office-Dokumenten.

Kopieren elektronischer Dokumente in den Ausgabeordner

Elektronische Dokumente können ohne Konvertierung und Erkennung in den Ausgabeordner kopiert werden, sodass der Seitenzähler Ihrer Lizenz nicht rückwärts zählt. Die folgenden Bedingungen müssen erfüllt sein:

  1. Die Eingabedateien müssen eine der folgenden Dateierweiterungen haben: *.doc, *.docx, *.xls, *.xlsx, *.rtf oder *.txt.
  2. Das Format aller Ausgabedateien muss mit dem Format der entsprechenden Eingabedatei übereinstimmen und die Eingabedateien dürfen nicht in andere Formate exportiert werden.
  3. In der 3. Dokumententrennung Registerkarte:
    • Die Option Ein Dokument für jede Datei im Job erstellen muss ausgewählt werden
    • Die Option Leere Seiten löschen darf nicht ausgewählt werden
  4. In der Registerkarte 4. Qualitätskontrolle muss die Option Keine Überprüfung ausgewählt werden.
  5. In der Registerkarte 5. Indexierung dürfen keine Dokumenttypen festgelegt werden.

Hinweis. Sobald alle oben genannten Bedingungen erfüllt sind, mit Ausnahme der letzten, d. h. ein oder mehrere Dokumenttypen sind in der Registerkarte 5. Indexierung festgelegt, werden die folgenden Vorgänge durchgeführt:

    • Die Eingabedateien werden konvertiert, erkannt und indexiert.
    • Der Seitenzähler Ihrer Lizenz wird durch die entsprechende Anzahl von Seiten rückwärts gezählt.
    • Die Eingabedateien mit den durch die Indexierung zugewiesenen Attributen werden in den Ausgabeordner kopiert.
Ausgabe- und Eingabedateien können in den gleichen Formaten, aber mit unterschiedlichen Formateinstellungen vorliegen (wie z. B. jeweils verschiedene festgelegte Seitengrößen). Standardmäßig werden die Einstellungen für das Ausgabeformat ignoriert und die Eingabedatei wird im Ist-Zustand in den Ausgabeordner kopiert. Wenn diese Eingabedateien auch verarbeitet werden müssen, ändern Sie das XML-Ticket für den entsprechenden Workflow entsprechend. Exportieren Sie dazu den Workflow, geben Sie IsExportSrcEdocAllowed=false in den Exportparametern in der XML-Datei an und importieren Sie das XML-Ticket in FineReader Server. Weitere Informationen finden Sie unter Workflow-Einstellungen in einem XML-Ticket ändern.
Weitere Informationen

Erstellen eines Skripts zur Dokumentenvorverarbeitung

3/26/2024 1:49:48 PM

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.