Creación de un script para la separación de documentos
ComprobarABBYY FineReader Server 14 permite configurar la separación de documentos con la ayuda de un script. Primero, se agregan marcas de separación según el método seleccionado; a continuación, se ejecuta el script, al que se pasan dichas marcas. Por lo tanto, el script puede usarse para ajustar o mejorar la regla de separación seleccionada utilizando el texto reconocido y códigos de barras.
El script se ejecuta por separado en cada página reconocida; en consecuencia, la separación de documentos no puede efectuarse como resultado de la comparación entre dos páginas. El script de separación de documentos permite definir el comienzo de un nuevo documento con base en el contenido de la página y en las propiedades, marcar una página para ser eliminada (es decir, si se trata de una página de separación o una página en blanco), o bien descartar el trabajo.
¡Importante!Los scripts de separación de documentos se activan en la estación de procesamiento. Por lo tanto, para que el script funcione correctamente con recursos compartidos, usted debe ejecutar las estaciones de procesamiento desde una cuenta de usuario que tenga los derechos necesarios para acceder a estos recursos.
Para crear y utilizar el script, realice lo siguiente:
- Abra la ficha 3. Separación de documentos del cuadro de diálogo Propiedades del flujo de trabajo.
- Seleccione uno de los métodos de separación de documentos incorporados (el método predeterminado es Crear un documento para cada trabajo) y haga clic en Script....
- En el cuadro de diálogo Editor de scripts que se abre, seleccione el lenguaje de scripting e introduzca el texto del script. Las referencias "this" o "Me" se refieren al objeto RecognizedPage.
- Para comprobar el script, haga clic en el botón Comprobar. Para guardar el script, haga clic en Aceptar.
¡Importante!Cuando se procesan documentos de varias páginas, el programa divide cada documento en varias partes, que se procesarán simultáneamente, cada una por un núcleo de procesador distinto. El número de páginas de cada parte se establece en el atributo PagesSlice. (El ajuste predeterminado es 25).
- Si modifica las propiedades del flujo de trabajo o la configuración de carga desde un archivo XML, de tal modo que PagesSlice=25, y posteriormente añade un script de separación de documentos al flujo de trabajo, los documentos no se dividirán y el atributo PagesSlice se establecerá automáticamente en «-1». Si el valor de PagesSlice es distinto de 25, no sufrirá ningún cambio.
- Si modifica las propiedades del flujo de trabajo o la configuración de carga desde un archivo XML, de tal modo que PagesSlice=-1, y no añade ningún script de separación de documentos al flujo de trabajo, el atributo PagesSlice se establecerá automáticamente en «25» y los documentos se dividirán en partes de 25 páginas.
Para obtener más detalles sobre el uso de scripts, consulte Utilización de scripts en ABBYY FineReader Server.
Muestra
El script de muestra que se proporciona a continuación está escrito en JScript y tiene como finalidad distribuir las páginas reconocidas entre documentos de tres grupos (artículos, currículos y folletos) usando páginas de separación. Si el texto de una página reconocida corresponde al establecido, se asigna a esta página el texto personalizado pertinente (propiedad CustomText del objeto RecognizedPage), mientras que la página se marca como primera del documento (propiedad IsStartingPage) y como página para eliminar (propiedad IsForDeletion). Por lo tanto, si ejecuta el script, se separa el documento en tres grupos y se eliminan las páginas de separación.
Nota. Este script se utiliza en el escenario de procesamiento de demostración «Demostración de scripting», cuya configuración está incluida en el archivo «ScriptingDemoWorkflow.xml», ubicado en la siguiente carpeta: Muestras (Inicio > Programas > ABBYY FineReader Server 14 > Ejemplos).
var pageText = Text;
var isArticle = pageText == "Separator sheet Document type: article";
var isResume = pageText == "Separator sheet Document type: resume";
var isBrochure = pageText == "Separator sheet Document type: brochure";
if( isArticle ) {
CustomText = "Article";
} else if( isResume ) {
CustomText = "Resume";
} else if( isBrochure ) {
CustomText = "Brochure";
}
if( isArticle || isResume || isBrochure ) {
IsStartingPage = true;
IsForDeletion = true;
}
Consulte también:
26.03.2024 13:49:49