识别文本

背景识别 是一个将临时文本图层添加到文档,使您可以标记、 复制和搜索其文本的过程。 您可以将永久文本图层添加到 PDF 文档,使其他用户也可以使用这些功能。 带有文本图层的文档几乎与其原件难以区分。 您还可以替换可搜索 PDF 文档中的现有文本图层。

  1. 在 主工具栏上,单击 按钮旁边的箭头符号,然后 识别文档... 从下拉列表中选择。 或者,还可以单击 文件 > 识别文档 > 识别文档... 或者按下 Ctrl+Shift+R
  2. 在打开的对话框中,指定适当的 OCR 语言。 也请参阅: 在 OCR 之前需考虑的文档特征
  3. 若要提高 OCR 质量,请启用图像处理。 图像处理可能会更改文档的外观。
    • 纠正页面方向 -程序将检测文本方向,必要时更正。
    • 去除图像弯曲并纠正图像分辨率 -程序将检测和更正任何倾斜、选择适当的图像分辨率,和进行一些其他更改以改善图像。
  4. 单击 识别 按钮。
  5. 因此,输出文件将包含可搜索文本图层。

将页面从一个文件添加到一个 PDF 文档时,或扫描纸质文档时,您也可以添加文本图层。 若要执行此操作,请选择 识别图像上的文字 对话框中的选项 图像处理设置 (单击 > > 图像处理设置 打开此对话框),指定文档的语言。 也请参阅: 处理页面

如果你想要检查已识别的文本、 培训程序来识别非标准字体和字符,或使用 ABBYY FineReader 的某些其他高级功能,单击箭头旁边的 按钮,然后单击 识别并在 OCR 编辑器中验证。 或者,还可以单击 文件 > 识别文档 > 识别并在 OCR 编辑器中验证也请参阅: 将 PDF 文档发送到 OCR 编辑器

02.11.2018 16:20:10

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.