图像预处理
此场景可用于准备有待进一步处理的图像,或者改善图像视觉质量(例如,扫描后或者识别前)。
此场景可以作为其他场景的组成部分,用在文档处理的第一步(即,准备待识别的文档)。用法示例包括创建用于存档的不可编辑文档副本、获取文档的可编辑版本、以及提取文档中有意义的数据。
在此场景中,需要对图像文件进行其他处理,例如:
- 自动检测页面方向
在文档页面扫描方向未知,并且可能不尽相同的情况下,这对于图像批量输入非常重要。
- 自动校正图像歪斜
它应用于需要对图像歪斜进行补偿的扫描文档。ABBYY FineReader Engine 提供了多种图像歪斜校正模式:使用成对黑色正方形、线条或者文本行。
- 图像去斑
扫描劣质到中等质量的文档时,可能会得到噪声非常严重的图像,上面有许多斑点。如果这些斑点出现在字母或数字附近,就会影响 OCR 的质量。用户可以指定要去除的斑点大小。去斑可以应用于图像,也可以应用于图像的任何单独区域。
- 将扫描书籍的对页拆分为两个单独图像
它用来将书籍作为跨页进行扫描,对于左边和右边页面都如此。如果页面拆分成两页,识别质量会更高,每页对应书中单独的一页。
- 将带有多张名片的扫描页面拆分成单独的图像
它应用于在一页上扫描的多张名片。然后,每张名片都可以单独处理和保存。
- 线条矫直
从扫描或者拍照的书中捕获文本时,文本行可能会不平,难以进行 OCR。为了准确进行文本识别,应该执行歪斜校正和文本行矫直。
- 纹理过滤
纹理过滤技术有助于过滤掉彩色或纹理之类的背景“噪声”,从而提高诸如报刊文章、彩色文档、传真件和复印件之类难以读取的文档的准确度。
- 去除数码照片的动态模糊和 ISO 噪点
系统会自动标识数字图像中常见的典型缺陷,如眩光、ISO 噪点。
- 剪除页边
需要改善页面外观时,您可能想要剪除一些图像区域,例如数码照片上多余的边缘。
预处理后,图像会保存为用户定义的格式或转发以进行进一步处理。
实现场景
下面详细介绍了在此场景中使用 ABBYY FineReader Engine 12 的推荐方法。
第1步加载 ABBYY FineReader Engine
第2步打开过程中预处理图像
第3步预处理已经打开的图像
第4步卸载 ABBYY FineReader Engine
所需资源
您可以使用 FREngineDistribution.csv 文件来自动创建应用程序正常工作所需的文件列表。若要用该方案进行处理,请在栏5 (RequiredByModule) 中对以下值进行选择:
内核
Core.Resources
打开
打开,处理
如果修改标准场景,请相应更改所需的模块。您还需要指定界面语言、识别语言和应用程序使用的任何其他功能( 例如,如果需要打开 PDF 文件,则使用 Opening.PDF;如果需要识别CJK 语言中的文本,则使用 Processing.OCR.CJK)。请参阅 借助 FREngineDistribution.csv 文件处理 进一步了解详情。
其他优化
以下是帮助文件中的相关章节,您可以在其中找到有关如何为不同处理步骤设置参数的更多信息:
- 图像预处理
- 处理图像
用 ABBYY FineReader Engine 处理图像,设置图像打开和预处理参数。 - PrepareImageMode 对象
该对象的参数会影响图像打开和预处理:歪斜校正、图像反转、镜像、准备好的图像压缩、分辨率、旋转。 - ImageDocument 对象
提供图像访问的主要对象。该方法可提供许多应用于打开的图像的预处理方法:修剪、双页拆分、照片预处理、视觉增强。 - ImageModification 对象
使用该对象对源图像进行其他处理(例如,用颜色替换图像的部分区域)。 - 拍照提示
通过拍照设备获取优质图像。 - 保存图像
- IImage::WriteToFile
使用该方法将图像保存到采用所选格式的文件。
另请参阅
17.09.2024 15:14:41