Chinese Simplified (简体中文)

English (English)

图像预处理

此场景可用于准备有待进一步处理的图像，或者改善图像视觉质量（例如，扫描后或者识别前）。

此场景可以作为其他场景的组成部分，用在文档处理的第一步（即，准备待识别的文档）。用法示例包括创建用于存档的不可编辑文档副本、获取文档的可编辑版本、以及提取文档中有意义的数据。

在此场景中，需要对图像文件进行其他处理，例如：

自动检测页面方向

在文档页面扫描方向未知，并且可能不尽相同的情况下，这对于图像批量输入非常重要。

自动校正图像歪斜

它应用于需要对图像歪斜进行补偿的扫描文档。ABBYY FineReader Engine 提供了多种图像歪斜校正模式：使用成对黑色正方形、线条或者文本行。

图像去斑

扫描劣质到中等质量的文档时，可能会得到噪声非常严重的图像，上面有许多斑点。如果这些斑点出现在字母或数字附近，就会影响 OCR 的质量。用户可以指定要去除的斑点大小。去斑可以应用于图像，也可以应用于图像的任何单独区域。

将扫描书籍的对页拆分为两个单独图像

它用来将书籍作为跨页进行扫描，对于左边和右边页面都如此。如果页面拆分成两页，识别质量会更高，每页对应书中单独的一页。

将带有多张名片的扫描页面拆分成单独的图像

它应用于在一页上扫描的多张名片。然后，每张名片都可以单独处理和保存。

线条矫直

从扫描或者拍照的书中捕获文本时，文本行可能会不平，难以进行 OCR。为了准确进行文本识别，应该执行歪斜校正和文本行矫直。

纹理过滤

纹理过滤技术有助于过滤掉彩色或纹理之类的背景“噪声”，从而提高诸如报刊文章、彩色文档、传真件和复印件之类难以读取的文档的准确度。

去除数码照片的动态模糊和 ISO 噪点

系统会自动标识数字图像中常见的典型缺陷，如眩光、ISO 噪点。

剪除页边

需要改善页面外观时，您可能想要剪除一些图像区域，例如数码照片上多余的边缘。

预处理后，图像会保存为用户定义的格式或转发以进行进一步处理。

实现场景

下面详细介绍了在此场景中使用 ABBYY FineReader Engine 12 的推荐方法。

第1步加载 ABBYY FineReader Engine

要开始使用 ABBYY FineReader Engine，您需要创建 Engine 对象。Engine 对象是 ABBYY FineReader Engine 对象层次体系中的顶级对象，提供各种全局设置、一些处理方法和用于创建其它对象的方法。

要创建 Engine 对象，您可以使用 InitializeEngine 导出的函数。另请加载 Engine 对象的不同方式。

C#

public class EngineLoader : IDisposable
{
    public EngineLoader()
    {
        // 用 FREngine.dll 的完整路径、客户项目 ID，
        // 以及（如适用）您的在线许可证令牌文件路径和在线许可证密码初始化这些变量
        string enginePath = "";
        string customerProjectId = "";
        string licensePath = "";
        string licensePassword = "";
        // 加载 FREngine.dll 库
        dllHandle = LoadLibraryEx(enginePath, IntPtr.Zero, LOAD_WITH_ALTERED_SEARCH_PATH);
           
        try
        {
            if (dllHandle == IntPtr.Zero)
            {
                throw new Exception("无法加载" + enginePath);
            }
            IntPtr initializeEnginePtr = GetProcAddress(dllHandle, "InitializeEngine");
            if (initializeEnginePtr == IntPtr.Zero)
            {
                throw new  Exception("无法找到 InitializeEngine 函数");
            }
            IntPtr deinitializeEnginePtr = GetProcAddress(dllHandle, "DeinitializeEngine");
            if (deinitializeEnginePtr == IntPtr.Zero)
            {
                throw new Exception("无法找到 DeinitializeEngine 函数");
            }
            IntPtr dllCanUnloadNowPtr = GetProcAddress(dllHandle, "DllCanUnloadNow");
            if (dllCanUnloadNowPtr == IntPtr.Zero)
            {
                throw new Exception("无法找到 DllCanUnloadNow 函数");
            }
            // 转换指针为代理
            initializeEngine = (InitializeEngine)Marshal.GetDelegateForFunctionPointer(
                initializeEnginePtr, typeof(InitializeEngine));
            deinitializeEngine = (DeinitializeEngine)Marshal.GetDelegateForFunctionPointer(
                deinitializeEnginePtr, typeof(DeinitializeEngine));
            dllCanUnloadNow = (DllCanUnloadNow)Marshal.GetDelegateForFunctionPointer(
                dllCanUnloadNowPtr, typeof(DllCanUnloadNow));
            // 调用 InitializeEngine 函数
            // 传递路径到在线许可证文件路径和在线许可证密码
            int hresult = initializeEngine(customerProjectId, licensePath, licensePassword, 
                "", "", false, ref engine);
            Marshal.ThrowExceptionForHR(hresult);
        }
        catch (Exception)
        {
            // 释放 FREngine.dll 库
            engine = null;
            // FreeLibrary 调用前删除所有对象
            GC.Collect();
            GC.WaitForPendingFinalizers();
            GC.Collect();
            FreeLibrary(dllHandle);
            dllHandle = IntPtr.Zero;
            initializeEngine = null;
            deinitializeEngine = null;
            dllCanUnloadNow = null;
            throw;
        }
    }
    // Kernel32.dll 函数
    [DllImport("kernel32.dll")]
    private static extern IntPtr LoadLibraryEx(string dllToLoad, IntPtr reserved, uint flags);
    private const uint LOAD_WITH_ALTERED_SEARCH_PATH = 0x00000008;
    [DllImport("kernel32.dll")]
    private static extern IntPtr GetProcAddress(IntPtr hModule, string procedureName);
    [DllImport("kernel32.dll")]
    private static extern bool FreeLibrary(IntPtr hModule);
    // FREngine.dll 函数 
    [UnmanagedFunctionPointer(CallingConvention.StdCall, CharSet = CharSet.Unicode)]
    private delegate int InitializeEngine(string customerProjectId, string licensePath, 
        string licensePassword, string tempFolder, string dataFolder, bool isSharedCPUCoresMode, 
        ref FREngine.IEngine engine);
    [UnmanagedFunctionPointer(CallingConvention.StdCall)]
    private delegate int DeinitializeEngine();
    [UnmanagedFunctionPointer(CallingConvention.StdCall)]
    private delegate int DllCanUnloadNow();
    // 私有变量
    private FREngine.IEngine engine = null;
    // FREngine.dll 句柄 
    private IntPtr dllHandle = IntPtr.Zero;
    private InitializeEngine initializeEngine = null;
    private DeinitializeEngine deinitializeEngine = null;
    private DllCanUnloadNow dllCanUnloadNow = null;
}

第2步打开过程中预处理图像

第3步预处理已经打开的图像

第4步卸载 ABBYY FineReader Engine

使用 ABBYY FineReader Engine 完成工作后，您需要卸载 Engine 对象。为此，请使用 DeinitializeEngine 导出功能。

C#

public class EngineLoader : IDisposable
{
    // 卸载 FineReader Engine
    public void Dispose()
    {
        if (engine == null)
        {
            // Engine 未加载 
            return;
        }
        engine = null;
        int hresult = deinitializeEngine();
        // 在 FreeLibrary 调用前删除所有对象
        GC.Collect();
        GC.WaitForPendingFinalizers();
        GC.Collect();
        int hresult = deinitializeEngine();

        hresult = dllCanUnloadNow();
        if (hresult == 0)
        {
            FreeLibrary(dllHandle);
        }
        dllHandle = IntPtr.Zero;
        initializeEngine = null;
        deinitializeEngine = null;
        dllCanUnloadNow = null;
        // 清理后引发异常
        Marshal.ThrowExceptionForHR(hresult);
    }
    // Kernel32.dll 函数
    [DllImport("kernel32.dll")]
    private static extern IntPtr LoadLibraryEx(string dllToLoad, IntPtr reserved, uint flags);
    private const uint LOAD_WITH_ALTERED_SEARCH_PATH = 0x00000008;
    [DllImport("kernel32.dll")]
    private static extern IntPtr GetProcAddress(IntPtr hModule, string procedureName);
    [DllImport("kernel32.dll")]
    private static extern bool FreeLibrary(IntPtr hModule);
    // FREngine.dll 函数
    [UnmanagedFunctionPointer(CallingConvention.StdCall, CharSet = CharSet.Unicode)]
    private delegate int InitializeEngine( string customerProjectId, string LicensePath, string LicensePassword, , , , ref FREngine.IEngine engine);
    [UnmanagedFunctionPointer(CallingConvention.StdCall)]
    private delegate int DeinitializeEngine();
    [UnmanagedFunctionPointer(CallingConvention.StdCall)]
    private delegate int DllCanUnloadNow();
    // 私有变量
    private FREngine.IEngine engine = null;
    // FREngine.dll 句柄
    private IntPtr dllHandle = IntPtr.Zero;
    private InitializeEngine initializeEngine = null;
    private DeinitializeEngine deinitializeEngine = null;
    private DllCanUnloadNow dllCanUnloadNow = null;
}

所需资源

您可以使用 FREngineDistribution.csv 文件来自动创建应用程序正常工作所需的文件列表。若要用该方案进行处理，请在栏5 (RequiredByModule) 中对以下值进行选择：

内核

Core.Resources

打开

打开，处理

如果修改标准场景，请相应更改所需的模块。您还需要指定界面语言、识别语言和应用程序使用的任何其他功能（例如，如果需要打开 PDF 文件，则使用 Opening.PDF；如果需要识别CJK 语言中的文本，则使用 Processing.OCR.CJK）。请参阅借助 FREngineDistribution.csv 文件处理进一步了解详情。

其他优化

以下是帮助文件中的相关章节，您可以在其中找到有关如何为不同处理步骤设置参数的更多信息：

图像预处理

处理图像
用 ABBYY FineReader Engine 处理图像，设置图像打开和预处理参数。
PrepareImageMode 对象
该对象的参数会影响图像打开和预处理：歪斜校正、图像反转、镜像、准备好的图像压缩、分辨率、旋转。
ImageDocument 对象
提供图像访问的主要对象。该方法可提供许多应用于打开的图像的预处理方法：修剪、双页拆分、照片预处理、视觉增强。
ImageModification 对象
使用该对象对源图像进行其他处理（例如，用颜色替换图像的部分区域）。
拍照提示
通过拍照设备获取优质图像。

保存图像

IImage::WriteToFile
使用该方法将图像保存到采用所选格式的文件。

另请参阅

基本使用场景实现

17.09.2024 15:14:41

Your use of this site is conditioned on Your continued compliance with the Terms of Use.

Terms of Use

Disclaimer of Warranty

Limitation of Liability

Transmission and Submission of Information

Downloads

Use of Content

Trademarks

Links to Third-Party Sites

Foreign Legislation

Subscription Terms

Partner Subscription Terms