识别带空格的词汇
您可使用 ABBYY FineReader Engine 将带空格的词汇添加至词典。该功能对于查找诸如“New York”一类的词汇非常有用。建议在字段级别的识别过程中使用含空格词汇的词典。这期间您可以使用一些有关所含数据类型的具体信息识别字段(包含文本短片段的小图像块)。例如,如需识别地址,词汇"New York"可能会有帮助。
如需识别带空格的词汇,请执行以下操作:
- 将"空格"字符添加到当前语言的字母表。
- 将带空格的所需词汇添加到词典。
- 将 RecognizerParams 对象的 OneWordPerLine 属性设为 TRUE。
以下是该操作的详细说明:
- 基于预定义语言创建一个新的文本语言。方法是使用 LanguageDatabase 对象的 CreateTextLanguage 方法创建一个 TextLanguage 对象并复制预定义语言的属性。
- 添加"空格"字符到 TextLanguage 对象内的 BaseLanguage 对象,方法是使用 BaseLanguage 对象的 LetterSet 属性。
- 创建一个新词典,然后将带空格的所有必需词汇添加到该词典。您可以使用 Dictionary 对象进行此操作。
- 创建一个 UserDictionaryDescription 对象。将新词典的路径添加到该对象的 FileName 属性。
- 添加 UserDictionaryDescription 对象到 BaseLanguage 对象的 DictionaryDescriptions 集合。
- 在所有文本块的 RecognizerParams 对象中,将之前创建的 TextLanguage 对象分配给 TextLanguage 属性,将 TRUE 值分配给 OneWordPerLine 属性。
以下示例展示了如何将"空格"字符添加至英语字母表以及如何将“New York”一词添加至词典。
另请参阅
03.07.2024 8:50:25