术语表

ABBYY FineReader 任务 是程序为了处理文档而执行的一组连续步骤。 ABBYY FineReader 14 包含用来满足最常见的文档处理需求的大量内置任务。 用户还可以创建自定义任务。 内置任务可在“新建任务”窗口中启动。

ABBYY Hot Folder 是一种计划代理程序,可以让您选择含有图像的文件夹并指定处理该文件夹中图像的时间。 ABBYY FineReader 将会自动处理选定文件夹中的图像。

ABBYY Screenshot Reader 是一个可以让用户创建屏幕截图并识别其中文本的应用程序。

ADF (自动送纸器)是一种将文档自动传给扫描仪的设备。 带有 ADF 的扫描仪不需手动操作就可扫描多个页面。ABBYY FineReader 可处理多页文档。

ADRT® (适应性文档识别技术,Adaptive Document Recognition Technology)是一种可以提高多页文档转换质量的技术。 例如,该技术能识别标题、页眉页脚、脚注、页码和签名等元素。

dpi (每英寸点数) 是图像分辨率的度量。

License Manager 是用于管理 ABBYY FineReader 许可证和激活 ABBYY FineReader 14 Corporate 的实用程序。

OCR (光学字符识别)是一种技术,使计算机可以读取文本、检测图片、表格和其他格式的元素。

OCR 项目 是 ABBYY FineReader 为处理文档而创建的项目。 项目中包含文档页面的图像、已识别的文本(若有) 和程序设置。

OCR 项目选项是可在 选项 对话框(单击 工具 > 选项... 打开此对话框)中选择的选项集合。 这些选项还包括用户语言和模式。 OCR 项目选项可以保存,然后应用到其他 OCR 项目中。

PDF (可移植文档格式) 是一种通用文档格式。 由于其包含的文本、字体和图形的详细说明,PDF 文档不论在何种计算机上显示,看起来都是一样的。

PDF 安全性设置 是防止打开、编辑、复制或打印 PDF 文档的限制。 这些设置包括文档打开密码、权限密码和加密级别。

Unicode 是由 UnicodeConsortium(Unicode,Inc.) 开发的国际文本编码标准,。 该标准提供了可轻松进行扩展的16位编码系统,用于编码来自几乎所有当代语言的符号。 它指定了如何编码符号,决定在编码过程中应使用何种算法和字符属性。

主要形式 是单词的”词典“形式(词典条目的词条通常以主要形式给出)。

产品 ID 是在给定计算机上激活 ABBYY FineReader 时,基于硬件配置而自动生成的参数。 它不包含任何个人信息或存储在您的计算机上的软件或数据相关信息。

返回顶部

亮度 是一个反映图像中白色数量的图像参数。 增加亮度可使图像变得“更白”。 指定适当的亮度值可增加识别品质。 也请参阅: 扫描提示

代码页 是建立字符代码与字符间相互关系的表。 用户可从代码页提供的字符集中选择所需字符。

倒像 是具有白色字符和黑暗背景的图像。

全字体系统 是无需事先训练就能识别任何字体的字符的识别系统。

分辨率 是以每英寸的点数 (dpi) 为单位的扫描参数。 设置为 10 pt 字体大小及更大的文本应使用 300 dpi 的分辨率,而较小字体大小(9pt 及更小)的文本适合使用 400 至 600 dpi 的分辨率。

分隔符 是可分隔单词的符号(如 /、\、划线),它们自身通过单词中的空格来分隔。

区域模板 是包含区域尺寸和位置信息的模板,这些区域位于外观相似的文档内。

“区域” 是图像上被边框所包围的部分,包含某种类型的数据。 ABBYY FineReader 在执行 OCR 之前,先要检测文本、图片、表格和条码区域,以确定图像上需要识别的部分以及识别顺序。

可选连字符 是一种连字符 (¬) ,表示当位于行尾的单词或词组需要拆开时,拆分的确切位置(如“autoformat”应拆分成“auto–format”)。 ABBYY FineReader 会以可选连字符替换词典单词中出现的所有连字符。

合成词 是由两个或更多现有单词组成的单词。 在 ABBYY FineReader 中, 合成词 是程序在其词典中查不到但其所构成的两个或更多词能在词典中查到的单词。

图片区域 是包含图片的区域。 此类区域可能包含实际图片或应显示为图片的其他任何对象(例如一段文本)。

返回顶部

字体效果 是字体的外观(即粗体、斜体、下划线、删除线、下标、上标、小写)。

带标记的 PDF 是一个包含逻辑部分、图片和表格等文档结构信息的 PDF 文档。 该结构通过 PDF 标记进行编码。 有此类标记的 PDF 文档可重新载入以适合各种屏幕尺寸,在手持设备上显示效果也很好。

序列号 是您购买程序时收到的唯一编号。 它用于程序激活。

快捷菜单 是当右键单击某处后出现的菜单,例如某个区域或文档另一个部分。

忽略的字符 单词中出现的任何非字母字符(如音节字符或重音符号)。 拼写检查时会忽略这些字符。

扫描仪 是将图像输入计算机的设备。

扫描模式 是一项扫描参数,它确定是否必须以黑白、灰度或彩色扫描图像。

支持 ID 是序列号的唯一标识符,它包含有关许可证及其使用所在计算机的信息。 支持 ID 提供额外保护,并在提供技术支持前由技术支持人员进行检查。

返回顶部

文本区域 是包含文本的图像区域。 文本区域只能含有单列文本。

文档分析 是识别包含多种数据类型的文档和区域逻辑结构的过程。 文档分析可以自动或手动执行。

文档类型 是一个参数,用于通知程序如何打印原始文本(例如,用激光打印机、用打字机等)。 激光打印的文本应选择 自动, 打字机打印的文本应选择 打字机, 传真打印应选择 传真

“文档打开”密码 是阻止用户打开 PDF 文档的密码,用户只有在键入作者指定的密码后才能打开该 PDF 文档。

权限密码 是用于防止其他用户打印和编辑PDF文档的密码,要进行上述操作则必须输入作者所指定的密码。 如果对文档选择了某些安全性设置,其他用户必须输入密码才能更改这些设置。

条形码区域 是一个包含条形码的图像区域。

模式 是平均字符图像和其各自名称之间关联的集合。 在特定文本中训练 ABBYY FineReader 时,会创建模式。

活动区域 是当前图像上的一块选定区域,可进行删除、移动或修改。 要激活一块区域,请单击它。 围绕激活区域的边框为粗体,且含有一些小方块,拖动这些方块可更改区域的大小。

激活 是从 ABBYY 获取特殊代码的过程,该代码允许用户在给定计算机上以完整方式使用该产品的副本。

禁用字符 是您认为将识别的文本中永远不会出现的字符。 指定这些禁用字符可提高 OCR 的速度和质量。

返回顶部

等宽字体 是一种字体(如 Courier New),该字体中所有字符的间隔相同。 要使等宽字体获得更好的 OCR 结果,在 OCR 选项卡, 选项 对话框中, 打字机文档类型 选项组中进行选择。

缩写 i单词或短语的简短形式(例如,MS-DOS 表示 Microsoft Disk Operating System,UN 表示 United Nations 等)。

置信度低的单词 是包含一个或多个置信度低字符的单词。

置信度低的字符 是程序可能错误识别的字符。

背景图片区域 是一个图像区域,它包含带有在该区域上打印的文本的图片。

自动化任务: ABBYY FineReader 14 的任务管理组件,可使您创建、设置和启动 ABBYY FineReader 任务。

色彩模式 确定是否要保留文档颜色。 黑白图像可以生成更小的 OCR 项目,且能够更快处理。

表格区域 是包含表格形式的数据的图像区域。 程序读取此类区域时,会在区域内部绘制垂直和水平分隔线以形成表格。  该区域在输出文本中显示为表格。

返回顶部

训练 是在字符图像和字符本身之间建立对应关系的过程。也请参阅: 如果您打印的文档包含非标准字体

识别区域 是 ABBYY FineReader 应自动分析的图像区域。

词形变化表 是单词所有语法形式的集合。

连字 是两个或更多“粘合”字符的组合(如 fi、fl、ffi)。 ABBYY FineReader 很难将这些字符分开。 将它们视为一个字符处理可提高 OCR 准确性。

键盘快捷方式 是按下时触发特定操作的按键或按键组合。 使用热键能显著提高您的效率。

页眉和页脚 是位于页面顶部或底部边缘的图像或文本。 页眉位于页面顶部,页脚位于页面底部。

页面布局 是页面上文本、表格、图片、段落和列的排列。 字体、字体大小、字体颜色、文本背景和文本方向也是页面布局的一部分。

驱动程序 是用于控制计算机外围设备(例如扫描仪、显示器等)的软件程序。

返回顶部

02.11.2018 16:20:10


Please leave your feedback about this article