术语表

A B C D F H J K L M P Q R S T U W Y Z

A

ABBYY Business Card Reader 是一种方便使用的应用程序,可以帮助扫描名片、捕捉联系人信息并将捕获的联系信息导出为多种电子格式。它还可以处理存储在用户计算机上的名片的扫描和制作照片。

ABBYY FineReader 文档是一类由 ABBYY FineReader 创建的对象,用于处理纸质文档。它包含文档页面的图像、所识别的文本(如果有)及程序设置。

ABBYY Hot Folder 是一种计划代理程序,可以让您选择含有图像的文件夹并指定处理该文件夹中图像的时间。ABBYY FineReader 将会自动处理选定文件夹中的图像。

ABBYY Screenshot Reader 是可以让用户创建屏幕截图并识别其中文本的应用程序。

ADRT®(适应性文档识别技术,Adaptive Document Recognition Technology)是一种可以提高多页文档转换质量的技术。例如,该技术能识别标题、页眉页脚、脚注、页码和前面等元素。

B

背景图片区域是一种图像区域,它包含带有在该区域上打印的文本的图片。

表格区域是包含表格形式的数据的图像区域。 程序读取此类区域时,会在区域内部绘制垂直和水平分隔线以形成表格。 该区域在输出文本中显示为表格。

C

词形变化表是单词所有语法形式的集合。

产品 ID 在给定计算机上激活 ABBYY FineReader 时,基于硬件配置而自动生成的参数。

返回顶部

D

代码页是建立字符代码与字符间相互关系的表。用户可从代码页提供的字符集中选择所需字符。

等宽字体是一种字体(如 Courier New),该字体中所有字符的间隔相同。要使等宽字体获得更好的 OCR 结果,请选择工具>选项...,单击文档选项卡,在文档类型下选择打字机

倒像是具有白色字符和黑暗背景的图像。

带标记的 PDF 是包含逻辑部分、图片和表格等文档结构信息的 PDF 文档。该结构通过 PDF 标记进行编码。有此类标记的 PDF 文档可重新载入以适合各种屏幕尺寸,在手持设备上显示效果也很好。

F

分隔符是可分隔单词的符号(如 /、\、划线),它们自身通过单词中的空格来分隔。

分辨率是以每英寸的点数 (dpi) 为单位的扫描参数。设置为 10pt 字体大小及更大的文本应使用 300 dpi 的分辨率,而较小字体大小(9pt 及更小)的文本适合使用 400 至 600 dpi 的分辨率。

H

活动区域是当前图像上的一块选定区域,可进行删除、移动或修改操作。要激活一块区域,请单击它。围绕激活区域的边框为粗体,且含有一些小方块,拖动这些方块可更改区域的大小。

合成词是由两个或更多现有单词组成的单词。在 ABBYY FineReader 中,合成词是在程度在其词典中查不到但其所构成的两个或更多词干能在词典中查到的单词。

忽略的字符是单词中出现的任何非字母字符(如音节字符或重音符号)。 拼写检查时会忽略这些字符。

返回顶部

J

激活是从 ABBYY 获取特殊代码的过程,该代码允许用户在给定计算机上以完整模式使用该产品的副本。

激活码是在激活过程中由 ABBYY 向每位 ABBYY FineReader 12 用户提供的一组代码。生成了产品 ID 的计算机需要激活代码来激活 ABBYY FineReader。

禁用字符是您认为绝对不会在要识别文本中出现的字符。指定这些字符可提高 OCR 的速度和质量。

K

可选连字符是一种连字符 (¬) ,表示当位于行尾的单词或词组需要拆开时,拆分的确切位置(如“autoformat”应拆分成“auto”和“format”)。 ABBYY FineReader 会以可选连字符替换词典单词中出现的所有连字符。

L

License Manager 是用于管理 ABBYY FineReader 的许可证和激活 ABBYY FineReader 12 Corporate Edition 的实用程序。

连字是两个或更多“粘合”字符的组合(如 fi、fl、ffi)。ABBYY FineReader 很难将这些字符分开。将它们一个字符处理可提高 OCR 准确性。

亮度是一个反应图像中白色数量的图像参数。增加亮度可使图像变得"更白"。指定适当的亮度值可增加识别品质。详情请参阅 "扫描纸质文档"。

M

每英寸的点数 (dpi) 是图像分辨率的度量标准。

模式是平均字符图像和其各自名称之间关联的集合。在特定文本中训练 ABBYY FineReader 时,会创建模式。

返回顶部

P

PDF 安全设置是可阻止打开、编辑、复制或打印 PDF 文档的一些限制。这些设置包括“文档打开密码”、“权限密码”和加密级别。

Q

区域是图像上被边框所包围的部分,包含某种类型的数据。ABBYY FineReader 在执行 OCR 之前,先要检测文本、图片、表格和条码区域,以确定图像上需要识别的部分以及识别顺序。

区域模板是包含区域尺寸和位置信息的模板,这些区域位于外观相似的文档内。

驱动程序是用于控制计算机外围设备(例如扫描仪、显示器等)的软件程序。

全字体系统是无需事先训练就能识别任何字体的字符的识别系统。

权限密码是阻止其他用户打印和编辑 PDF 文档的密码,这些用户只有在键入作者指定的密码后才可对该文档进行这些操作。如果为文档选择了某些安全设置,则其他用户必须键入作者指定的密码方可更改这些设置。

R

任务管理器是 ABBYY FineReader 的功能部件,可以让您运行自动化任务、创建并修改自动化任务,以及删除自定义自动化任务。

S

扫描仪是将图像输入计算机的设备。

扫描模式是一项扫描参数,它确定是否必须以黑白、灰度或彩色扫描图像。

识别区域是 ABBYY FineReader 自动分析的图像区域。

缩写词是完整单词或短语的简短形式(例如,使用 MS-DOS 表示 Microsoft Disk Operating System,使用 UN 表示 United Nations 等)。

色彩模式确定是否保留文档颜色。黑白图像可以生成更小的 FineReader 文档,且能够更快处理。

训练是在字符图像和字符本身之间建立对应关系的过程。(有关详细信息,请参见识别及训练部分。)

返回顶部

T

条码区域是包含条码的图像区域。

图片区域是包含图片的图像区域。此类区域可以包含实际图片或将显示为图片的其他任何对象(如文本部分)。

U

Unicode 是一种由 Unicode Consortium (Unicode, Inc.) 开发的标准,它是用于处理文本的 16 位国际编码系统。

W

文档分析是识别包含多种数据类型的文档和区域逻辑结构的过程, 可以自动或手动执行文档分析。

文档打开密码是阻止用户打开 PDF 文档的密码,用户只有在键入作者指定的密码后才能打开该 PDF 文档。

文档选项选项对话框(工具>选项)中可以选择的一组选项。文档选项还包含用户语言和模式。用户可保存文档选项,然后在其他 ABBYY FineReader 文档中使用。

文档类型是一个参数,用于通知程序如何打印原始文本(例如,用激光打印机、用打字机等)。激光打印的文本应选择自动;打字机打印的文本应选择打字机;传真打印应选择传真

文本区域是包含文本的图像区域。文本区域只能含有单列文本。

Y

页面布局是页面上文本、表格、图片、段落和列的排列。字体、字体大小、字体颜色、文本背景和文本方向也是页面布局的一部分。

Z

自动化任务是若干处理步骤的集合。ABBYY FineReader 12 包含许多预配置的自动化任务,可通过任务窗口访问。用户也可以创建自己的自动化任务。

自动送纸器 (ADF) 是一种将文档自动传给扫描仪的设备。带有 ADF 的扫描仪不需手动操作就可扫描多个页面。 ABBYY FineReader 可处理多页文档。

置信度低的字符是程序可能错误识别的字符。

置信度低的单词是包含一个或多个置信度低字符的单词。

字体效果是字体的外观(如粗体、斜体、下划线、删除线、下标、上标、小写)。

支持 ID 是序列号的唯一标识符,它包含有关许可证及其使用所在计算机的信息。支持 ID 提供额外保护,并在提供技术支持前由技术支持人员进行检查。

主要形式是单词的”词典“形式(词典条目的词条通常以主要形式给出)。

返回顶部

14.01.2020 17:26:22


Please leave your feedback about this article