Chinese Simplified (简体中文)

识别带空格的词汇

您可使用 ABBYY FineReader Engine 将带空格的词汇添加至词典。该功能对于查找诸如“New York”一类的词汇非常有用。建议在字段级别的识别过程中使用含空格词汇的词典。这期间您可以使用一些有关所含数据类型的具体信息识别字段(包含文本短片段的小图像块)。例如,如需识别地址,词汇"New York"可能会有帮助。

如需识别带空格的词汇,请执行以下操作:

  1. 将"空格"字符添加到当前语言的字母表。
  2. 将带空格的所需词汇添加到词典。
  3. RecognizerParams 对象的 OneWordPerLine 属性设为 TRUE。

以下是该操作的详细说明:

  1. 基于预定义语言创建一个新的文本语言。方法是使用 LanguageDatabase 对象的 CreateTextLanguage 方法创建一个 TextLanguage 对象并复制预定义语言的属性。
  2. 添加"空格"字符到 TextLanguage 对象内的 BaseLanguage 对象,方法是使用 BaseLanguage 对象的 LetterSet 属性。
  3. 创建一个新词典,然后将带空格的所有必需词汇添加到该词典。您可以使用 Dictionary 对象进行此操作。
  4. 创建一个 UserDictionaryDescription 对象。将新词典的路径添加到该对象的 FileName 属性。
  5. 添加 UserDictionaryDescription 对象到 BaseLanguage 对象的 DictionaryDescriptions 集合。
  6. 在所有文本块的 RecognizerParams 对象中,将之前创建的 TextLanguage 对象分配给 TextLanguage 属性,将 TRUE 值分配给 OneWordPerLine 属性。

以下示例展示了如何将"空格"字符添加至英语字母表以及如何将“New York”一词添加至词典。

C++ (COM) 代码

C# 代码

另请参阅

处理语言

借助字典进行处理

字段别识别

24.03.2023 8:51:52

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.