PDF 文档类型

PDF 文档的功能取决于创建它的程序。 有些 PDF 文档可搜索并包含您可以复制的文本,而在其他文档中,只有当您在 ABBYY FineReader 等特殊应用程序中打开时才能进行这些操作。 PDF 文档有三种类型。

仅包含图像的 PDF 文档

仅包含图像的 PDF 文档是从硬拷贝文档的扫描件创建而得。 这种文档只包含页面图像,没有文本图层。 仅包含图像的 PDF 无法搜索,其包含的文本无法在 PDF 查看应用程序中修改或标记。

ABBYY FineReader 14 采用特殊 的后台 OCR 进程, 通过在只包含图像的文档中创建临时文本图层,使您能够搜索其内容、复制其文本,甚至 编辑页面图像。 另外, ABBYY FineReader 14 还能让您 将此文本图层保存在 文档中,以便您搜索文档中的文本并复制到其他应用程序中。 也请参阅: PDF 设置

可搜索的 PDF 文档

可搜索的 PDF 文档包括页面图像和其下方的不可见的页面图层。 此类文档通常由扫描和识别纸质文档并将其识别出的文本保存在文本图层中而创建。

当你在 ABBYY FineReader 中打开 PDF 文档时,它会分析文档,以确定其是否包含可用的文本图层。 也请参阅: OCR 选项。 如果存在文本图层,则文档中的文本可以搜索和复制到任何 PDF 应用程序中。 不同于许多其他 PDF 应用程序,ABBYY FineReader 还允许您编辑可搜索的 PDF 文档中的文本。

在 ABBYY FineReader 中,可搜索的 PDF 文档可通过下列方式创建:

  1. 向仅包含图像的 PDF 文档 添加 文本图层。
  2. 将 PDF 文档和图像文件转换成可搜索的 PDF 格式。 为此,请在 PDF 格式设置中启用选项组的 页面图像下方的文本 选项 可搜索 PDF 设置也请参阅: PDF 设置

在其他应用程序中创建的 PDF 文档

可搜索的 PDF 文档可以从各种格式可编辑的文档(例如 DOCX)中创建。 此类文档包含文本图层和图片,但不包含页面图像。 这些文档可搜索且其文本和图片可复制和编辑,前提是这些操作不需要输入密码或者用户知道密码。

此类 PDF 文档可通过下列方式创建:

  1. 在创建它的程序中打开可编辑文档并保存为 PDF。
  2. 使用 ABBYY FineReader 将另一种类型的 PDF 文档或其他格式的文档转换成此类 PDF(在 PDF 格式设置中,启用选项组中的 仅文本和图片 选项 可搜索 PDF 设置)。 也请参阅: PDF 设置

生成的文档比其他类型的 PDF 文档更易于编辑,但是外观看起来可能不同于原始文档。

02.11.2018 16:20:10


Please leave your feedback about this article