处理字体
文档识别结果取决于处理过程中使用的字体及其设置。ABBYY FineReader Engine 提供可用字体使用选项,但是 在某些情况下 需要手动设置字体:
- 您使用的操作系统字体有限或者没有字体(例如,Docker 容器内的 Windows Server Core)
- 您的文档包含特定的字体(例如,非拉丁字体)
在这些情况下, 在启动 应用程序前设置字体非常重要,因为有些处理阶段需要使用正确调整过的字体:
- PDF 打开
- 文档合成
- 导出为 PDF格式
本文包含有关手动设置字体的有用信息,介绍了ABBYY FineReader Engine 的字体处理功能。
PDF 打开
PDF包含有关创建它所使用的字体的信息。该信息对于 PDF 光栅化必不可少,例如,处理来自图片的可见文本并确定使用的字体及其参数。为了在输出 PDF中呈现正确字体,您需要将所需字体的文件复制到分发包的 Data\Resources\Font 文件夹。ABBYY FineReader Engine 会在操作过程中自动嵌入这些字体。
所需字体包括:
- Arial
- Times New Roman
- Courier New
文档合成和导出为 PDF格式
当合成文档或将其导出为 PDF 格式时,ABBYY FineReader Engine 会从ISynthesisParamsForDocument::FontSet 属性中指定的字体集中选择最佳字体。默认情况下,该集合中的字体数量会进行优化以达到处理速度和输出文档质量之间的平衡。
手动设置字体:
1. 选择电脑上要进行字体存储的任何文件夹。
2. 将所需字体文件复制到该文件夹中。文档合成和导出的推荐字体在 FontNamesFiltersEnum 枚举中列出。
3. 通过 CustomFontSet 对象的 Folder 属性指定含有字体的文件夹。
如果需要更改默认字体集,请参考以下建议方法:
- 对于特定语言,可以使用预定义字体筛选,例如 FNF_Chinese,FNF_Japanese。通过 SystemFontSet 或 CustomFontSet 对象的 FontNamesFilter 属性。
- 您可以在 SystemFontSet 或 CustomFontSet 对象的 FontNamesCustomFilter 属性中指定文档的特定字体系列。
- 您可以通过 SystemFontSet 或 CustomFontSet 对象的 FontNamesFilter 属性中的字体指定 FNF_FineReader 筛选器。该筛选器可以为 FineReader Engine 在文档合成过程提供更多字体,与默认模式相比字体更好。不过,处理速度可能会因此减缓。此功能可能会在转换为可编辑格式等情况下用到。在指定该筛选器前,请检查它使用的字体列表,并确保工作站上存在这些字体。
另请参阅:
9/17/2024 3:14:41 PM