提高处理速度
处理速度取决于图像质量(请参见源图像建议)和处理期间使用的设置。若要提高处理速度,您也可以关闭一些不必要的功能。
通用建议
以下建议适用于所有类型的文档。无论您处理哪类文档,我们建议您选择正确的设置:
- ABBYY FineReader Engine 12 提供一整套为主要使用场景设计的预定义配置文件。大多数配置文件有两种形式:以最终文档质量为优化导向的设置和以处理速度为优化导向的设置。使用速度优化的配置文件。您可以在配置文件的处理中找到可用的预定义配置文件列表。
- 指定正确的识别语言。不正确的语言会大幅降低文档处理速度。选择的识别语言越多,处理速度越慢。
- 使用 FRDocument 对象来处理多页文档,使用 BatchProcessor 对象来处理大量单页或多页文档,因其可使用平行处理。请参见 使用 ABBYY FineReader Engine 进行平行处理 了解详情。
- 指定适当的分析和识别参数。例如,如果您的文档包含表格,则可设置 PageAnalysisParams 对象的 DetectTables 属性为 FALSE。如果文档方向不正确,则不要将 PageProcessingParams 对象的 CorrectOrientation 属性设为 TRUE。
其它设置
您可以根据处理文档类型和想要的结果决定是否使用这些设置:
- 如果处理的是黑白图像,或者图像颜色不重要,可将 PrepareImageMode 对象的 DiscardColorImage 属性设为 TRUE。
- 将 PrepareImageMode 对象的 UseFastBinarization 属性设为TRUE。在此情况下,ABBYY FineReader Engine 将使用快速图像二进制算法;不过,二进制质量可能会降低。
- 如要在文档处理中执行方向检测(IPagePreprocessingParams::CorrectOrientation 属性为 TRUE),您可以选择方向检测快速模式:将 OrientationDetectionParams对象的 OrientationDetectionMode 属性设为 ODM_Fast。
- 将 PageAnalysisParams 对象的 EnableTextExtractionMode 属性设为TRUE。这将加速文档分析进程。
- 将 ObjectsExtractionParams 对象的 FastObjectsExtraction 属性设为TRUE。这将加速对象提取。
- 通过设置 RecognizerParams 对象的 Mode 属性为 RM_Fast 以在快速模式中进行识别。注意,使用快速模式可能降低识别质量。
- 如果您的文档不包含该类型的任何元素(例如,没有脚注或者目录),您可以关闭 DocumentStructureDetectionParams 对象的一些属性。在此情况下,文档合成将会提速。
- 如果格式和文档结构对文档并不重要,则可以进一步加快文档合成的速度。如果将 DetectFontFormattingAtPageLevel 对象的 SynthesisParamsForPage 属性设为 TRUE,则可以在文档合成期间关闭检测字体参数和文档结构(将 SynthesisParamsForDocument 的 DetectFontFormatting 和 DetectDocumentStructure 设为FALSE)。该方式可在一些预定义的配置文件中使用。您可以另外设置 FontFormattingDetectionParams 对象的参数。
- 如果要将文档导出为 TXT 格式或 PDF ImageOnly 格式,则可以完全跳过文档合成阶段。将文档导出为上述格式期间,不使用文档合成信息。
- 如果导出识别文档为 PDF 格式,请设置 PDFExportParams 对象的 Scenario 属性。该属性可优化某些参数的导出:质量、文件大小,或/和导出速度。您可以选择 PES_MaxSpeed 作为属性值以获得最快的导出速度。
- 如果要导出大文档(50页或更多)为PDF格式,则强烈建议使用 ExportFileWriter。识别的数据将按部分逐一存入 PDF中,这将极大地提高导出速度。请参见 导出大文档 了解详情。
另请参阅
03.07.2024 8:50:25