OCR 选项

如果您想要快速获得准确结果,选择正确的 OCR 选项至关重要。 决定您想要使用哪些选项时,不仅应考虑文档的类型和复杂度,还应考虑您打算如何使用生成的结果。 以下选项组可用:

您可以在 OCR 对话框 选项 (单击 工具 > 选项... 打开此对话框)中的选项卡上找到 OCR 选项。

ABBYY FineReader 自动识别您添加到 OCR 项目中的任何页面。 当前选定的选项将用于 OCR。 您可以在对话框的选项卡上 图像处理 (单 选项工具 > 选项... 打开此对话框)关闭自动分析和 OCR 新添加的图像。

如果您在识别了一个文档后更改了 OCR 选项,再次执行 OCR 用新的选项识别文档。

PDF 识别模式

这些设置适用于含有文本图层和图片的 PDF 文档。 这些 PDF 文档通常是从格式可编辑的的文档创建的。 其他类型的 PDF 文档,例如可搜索的 PDF 和仅包含图像的 PDF 始终在 使用 OCR 模式下处理,这是针对这些类别的 PDF 的默认模式。 处理这些 PDF 不需要其他额外设置。

可使用三种识别模式:

    • 自动在 OCR 和 PDF 中的文字之间选择
      程序将检查文本图层,并且如果现有的文本图层包含的文本质量较好,将使用现有的文本图层。 否者,将使用 OCR 创建新的文本图层。
    • 使用 OCR
      OCR 将用于创建新的文本图层。 此模式需要的时间更长,但是更适用于处理含有质量较差的文本图层的文档。
    • 仅使用 PDF 中的文字
      这是带有文本图层的 PDF 文档的默认模式。 程序将使用原始的文本图层而不执行 OCR。

在 OCR 速度和准确度之间平衡

ABBYY FineReader 14 允许您执行下列操作:

  • 通篇识别
    在该模式下,ABBYY FineReader 可分析并识别简单文档、布局复杂的文档、含有在彩色背景下打印的文本的文档和带有复杂表格(包括带有白色网格线的表格和带有彩色单元格的表格)的文档。
    通篇识别 需要的时间更长,但是质量更好。
  • 快速识别
    推荐用这种模式来处理拥有简单布局和高质量图像的大文档。

打印类型

指定用于打印文档的设备类型。 也请参阅: 在 OCR 之前需考虑的文档特征

检测结构元素

选择您让程序检测的结构元素:页眉和页脚、脚注、目录和列表。 保存文档时,选择的元素可点击。

条形码

如果您的文档中包含条形码并且希望将其转换成字母和数字串而非保存为图片,请选择 转化条形码为字符串。 此功能默认禁用。

模式和语言

识别及训练用于识别下列类型的文本:

  • 带有特殊符号的文本(例如,数学符号)
  • 带有装饰元素的文本
  • 来自低质量图像的大量文本(超过 100 页)

训练 默认禁用。 启用 使用训练以识别新字符和连字 在执行 OCR 时训练 ABBYY FineReader。

您可以在识别时使用内置模式或您自己定义的模式。

您可以为用户模式和语言保存和加载设置。 也请参阅: OCR 项目

字体

当您保存识别出的文本时,您可以在此选择要使用的字体。

要选择字体:

  1. 单击 选择字体... 按钮。
  2. 选择所需的字体,并单击 确定

02.11.2018 16:20:10


Please leave your feedback about this article