Cómo procesar documentos de Office
ABBYY FineReader Server le permite procesar archivos de Office (doc, docx, xls, xlsx, ppt, pptx, etc.) en el mismo flujo de trabajo que los archivos de imagen.
Procesar archivos de Office en ABBYY FineReader Server
De manera predeterminada, los documentos de Office se procesan mediante el componente Compatibilidad con formatos de archivo de Office, que puede instalarse junto con el componente Estación de procesamiento.
También puede procesar archivos de Office en ABBYY FineReader Server usando un script que los convierte a archivos de imagen o usando una API.
Procesar archivos de Office usando Microsoft Office o LibreOffice
Para obtener unos resultados óptimos, puede procesar los documentos de Office usando una aplicación de terceros que esté instalada en el mismo equipo que ABBYY FineReader Server. ABBYY FineReader Server puede integrarse con Microsoft Office 2013 (o versiones posteriores) y con LibreOffice 4 (o versiones posteriores).
Nota. Para garantizar una correcta integración con ABBYY FineReader Server, instale LibreOffice en la carpeta predeterminada que haya utilizado el instalador del programa en el disco del sistema.
Nota. En algunos casos, la conversión de documentos de Office puede dar error debido a problemas con determinadas versiones de LibreOffice. (Consulte la base de conocimiento de ABBYY para obtener más información).
Configuración del procesamiento
Para configurar el procesamiento de documentos de Office en ABBYY FineReader Server, complete los siguientes pasos:
- Seleccione los roles Procesamiento previo o Procesamiento y procesamiento previo para una o más estaciones de procesamiento. En los equipos en los que se ejecuten las estaciones de procesamiento con estos roles deben estar instalados Microsoft Office o LibreOffice.
- Abra la pestaña 2. Proceso del cuadro de diálogo Propiedades del flujo de trabajo. En la lista desplegable Modo de procesamiento de documentos de Office, seleccione un programa (Microsoft Office o LibreOffice) para abrir documentos de Office.
- Especifique las credenciales de la cuenta de usuario (nombre de usuario y contraseña) con la que se ejecutará el programa.
- Si la estación de procesamiento del Servidor de reconocimiento está funcionando con la cuenta de sistema local y se va a utilizar Microsoft Office 2013, 2016 o 2019 especifique el nombre y la contraseña de la cuenta de usuario.
- Si la estación de procesamiento del Servidor de reconocimiento está funcionando con una cuenta de usuario y se va a utilizar Microsoft Office 2013, no hace falta introducir nombre y contraseña de usuario.
- Si la estación de procesamiento del FineReader Server está funcionando con una cuenta de usuario y se va a utilizar Microsoft Office 2016 o 2019, reinicie el servicio con la cuenta de sistema local y especifique el nombre y la contraseña de la cuenta de usuario.
Nota. Se procesan los archivos en los siguientes formatos por defecto: DOC, DOCX, ODT, HTM, HTML, TXT, RTF, XLS, XLSX, ODS, PPT, PPTX, ODP.
Nota. Puede cambiarse la lista de formatos compatibles. Para hacer esto en el archivo de configuración (% PROGRAMDATA%\ABBYY FineReader Server 14\Configuration.xml) deberá especificar un conjunto de extensiones de archivos requeridas para su aplicación Office respectiva (consulte los atributos WordFilesMask, ExcelFilesMask, PowerPointFilesMask, VisioFilesMask de la etiqueta \OnFileReceivedCustomOffice\ CustomOfficeConversionParams\CustomOfficeApplications tag). Por ejemplo, si especifica WordFilesMask="*.doc;*.docx;", entonces los archivos DOC y DOCX se abrirán con Microsoft Office Word o LibreOffice Writer (dependiendo de su aplicación de Office), pero la aplicación para procesar los archivos RTF no se encontrará.
Nota. Los archivos de Office no serán leídos por una aplicación externa si:
- la aplicación externa no tiene licencia o tiene una licencia sin activar,
- la aplicación externa no es la aplicación predeterminada para abrir archivos de Office.
Copiar documentos electrónicos a la carpeta de salida
Los documentos electrónicos se pueden copiar a la carpeta de salida sin conversión ni reconocimiento para que el contador de páginas de su licencia no disminuya. Deben cumplirse las siguientes condiciones:
- Los archivos de entrada han de tener una de las extensiones de archivo siguientes: *.doc, *.docx, *.xls, *.xlsx, *.rtf o *.txt.
- El formato de cada archivo de salida debe ser el mismo que el formato del archivo de entrada correspondiente, y los archivos de entrada no se deben exportar a otros formatos.
- En la ficha 3. Separación de documentos:
- Debe seleccionarse la opción Crear un documento para cada archivo del trabajo.
- No debe seleccionarse la opción Eliminar páginas en blanco.
- En la ficha 4. Control de calidad, deben seleccionarse los archivos adjuntos de No verificación.
- En la ficha 5. Indización, no se debe especificar ningún tipo de documento.
Nota. Si todas las condiciones anteriores se cumplen con excepción de la última, es decir, si se han especificado uno o más tipos de documento en la ficha 5. Indización, se ejecutarán las operaciones siguientes:
- Los archivos de entrada se convertirán, reconocerán e indexarán.
- El contador de páginas de su licencia disminuirá el número de páginas correspondiente.
- Los archivos de entrada con los atributos asignados por indexación se copiarán a la carpeta de salida.
Es posible tener archivos de salida y entrada en los mismos formatos pero con diferentes ajustes de formato (p. ej., con el tamaño especificado de página diferente en cada uno). Por defecto, se ignorará la configuración del formato de salida y el archivo de entrada se copiará tal cual en la Carpeta de salida. Si también es necesario procesar estos archivos de entrada, modifique en consecuencia el vale XML para el flujo de trabajo correspondiente. Para ello, exporte el flujo de trabajo, especifique IsExportSrcEdocAllowed=false en los parámetros de exportación del archivo XML e importe el vale XML a FineReader Server. Para obtener más información, consulte Cómo modificar la configuración del flujo de trabajo en un vale XML.
26.03.2024 13:49:49