Traitement Documents Office
ABBYY FineReader Server vous permet de traiter des documents Office (c.-à-d., DOC, DOCX, XLS, XLSX, PPT, PPTX, etc.) dans le même workflow que les fichiers image.
Traitement des documents Office dans ABBYY FineReader Server
Par défaut, les documents Office sont traités par le composant Prise en charge des formats de fichier Office, qui peut être installé en même temps que le composant Poste de traitement.
Dans ABBYY FineReader Server, vous pouvez également traiter des documents Office à l'aide d'un script qui les convertira en fichiers image ou à l'aide de l'API.
Traitement de documents Office à l'aide de Microsoft Office ou de LibreOffice
Pour obtenir de meilleurs résultats, vous pouvez traiter les documents Office à l'aide d'une application tierce installée sur le même ordinateur qu'ABBYY FineReader Server. ABBYY FineReader Server prend en charge l'intégration à Microsoft Office 2013 ou version ultérieure et à LibreOffice 4 ou version ultérieure.
Note. Pour assurer la bonne intégration à ABBYY FineReader Server, installez LibreOffice dans le dossier par défaut utilisé par le programme d'installation de LibreOffice sur le disque système.
Note. Il arrive parfois que la conversion de documents Office échoue en raison de problèmes avec certaines versions de LibreOffice (pour plus de détails, consultez la Base de connaissances ABBYY).
Configuration du traitement
Pour la configuration du traitement de documents Office dans ABBYY FineReader Server, procédez comme suit :
- Sélectionnez le rôle Prétraitement ou Traitement et prétraitement pour un ou plusieurs postes de traitement. Microsoft Office ou LibreOffice doit être installé sur les ordinateurs exécutant les postes de traitement avec ces rôles.
- Ouvrez l'onglet 2. Traitement de la boîte de dialogue Propriétés du workflow. Dans la liste déroulante Mode de traitement des documents Office, sélectionnez un programme MS Office ou LibreOffice pour ouvrir les documents Office.
- Spécifiez les informations d'identification du compte utilisateur (identifiant et mot de passe) avec lesquelles le programme sera exécuté.
- Si le service du poste de traitement de FineReader Server est exécuté sous le compte du système local et si Microsoft Office 2013, 2016 ou 2019 doit être utilisé, spécifiez l'identifiant et le mot de passe du compte utilisateur.
- Si le service du poste de traitement de FineReader Server est exécuté sous un compte utilisateur et si Microsoft Office 2013 doit être utilisé, aucun identifiant et aucun mot de passe ne sont requis.
- Si le service du poste de traitement de FineReader Server est exécuté sous un compte utilisateur et si Microsoft Office 2016 ou 2019 doit être utilisé, redémarrez le service sous le compte du système local et spécifiez l'identifiant et le mot de passe du compte utilisateur.
Note. Les fichiers aux formats suivants seront traités par défaut : DOC, DOCX, ODT, HTM, HTML, TXT, RTF, XLS, XLSX, ODS, PPT, PPTX, ODP.
Note. La liste des formats pris en charge peut être modifiée. Pour modifier la liste, dans le fichier de configuration (% PROGRAMDATA%\ABBYY FineReader Server 14\Configuration.xml), indiquez l'ensemble d'extensions de fichier nécessaire au programme sélectionné pour ouvrir les documents Office (voir les attributs WordFilesMask, ExcelFilesMask, PowerPointFilesMask, VisioFilesMask de la balise \OnFileReceivedCustomOffice\ CustomOfficeConversionParams\CustomOfficeApplications). Par exemple, si vous indiquez WordFilesMask="*.doc;*.docx;", alors les fichiers DOC et DOCX seront ouverts par Microsoft Office Word ou LibreOffice Writer (en fonction du programme que vous avez sélectionné), mais aucun programme ne sera trouvé pour le traitement des fichiers RTF.
Note. Les programmes tiers ne liront pas les documents Office sous les conditions suivantes :
- Le programme tiers n'a pas de licence ou sa licence n'a pas été activée.
- Le programme tiers n'est pas le programme par défaut pour ouvrir les documents Office.
Copier des documents électroniques dans le dossier Sortie
Les dossiers électroniques peuvent être copiés dans le dossier de sortie sans conversion ni reconnaissance, ainsi, le compteur des pages de votre licence ne sera pas décrémenté. Les conditions suivantes doivent être remplies :
- Les fichiers d'entrée doivent contenir une des extensions de fichier suivantes : *.doc, *.docx, *.xls, *.xlsx, *.rtf ou *.txt.
- Le format de chaque fichier de sortie doit être le même que le format du fichier d'entrée correspondant et les fichiers d'entrée ne doivent pas être exportés dans d'autres formats.
- Dans l'onglet 3. Séparation des documents :
- L'option Créer un document pour chaque fichier de la tâche doit être sélectionnée
- L'option Supprimer les pages vierges ne doit pas être sélectionnée
- Dans l'onglet 4. Contrôle qualité, l'option Aucune vérification doit être sélectionnée.
- Dans l'onglet 5. Indexation, aucun type de document ne doit être spécifié.
Note. Si toutes les conditions ci-dessus sont remplies à l'exception de la dernière, c.-à-d. si au moins un type de document est spécifié dans l'onglet 5. Indexation, les opérations suivantes seront effectuées :
- Les fichiers d'entrée seront convertis, reconnus et indexés.
- Le compteur de pages de votre licence sera décrémenté du nombre de pages correspondant.
- Les fichiers d'entrée disposant des attributs que l'indexation leur a attribués seront copiés dans le dossier Sortie.
Il est possible d'avoir des fichiers de sortie et d'entrée au même format, mais avec des paramètres de format différents (ex., avec des tailles de page différentes spécifiées pour chacun). Par défaut, les paramètres de format de sortie seront ignorés et le fichier d'entrée sera copié dans le dossier de sortie tel quel. Si ces fichiers d'entrée doivent également être traités, modifiez le ticket XML pour le flux de travail approprié en conséquence. Pour ce faire, exportez le flux de travail, spécifiez IsExportSrcEdocAllowed =false dans les paramètres d'exportation du fichier XML et importez le ticket XML sur FineReader Server. Pour plus d'informations, voir Comment modifier les paramètres de flux de travail dans un ticket XML.
Voir aussi
3/26/2024 1:49:50 PM