正则表达式

下表列出了可用于创建自定义语言词典的正则表达式。

注:

  1. 要将正则表达式符号作为正常字符使用,请在符号前添加反斜线。例如,[t-v]x+ 代表 tx、txx、txx 等和 ux、uxx 等,而 \[t-v\]x+ 则代表 [t-v]x、[t-v]xx、[t-v]xxx 等。
  2. 要分组正则表达式元素,请使用括号。例如,(a|b)+|c 代表 c 或任何类似 abbbaaabbb、ababab 的组合(任何长度非零、其中可能有按任意顺序排列的任意个数的 a 和 b 的单词),而 a|b+|c 则代表 a、c 和 b、bb、bbb 等。

示例

假设您在识别一个包含三列的表格:出生日期、姓名、电子邮件地址。在这种情况下,您可以创建两种新语言、数据和地址,并为它们指定以下正则表达式。

日期的正则表达式:

表示日的数字可由一位数字(1、2 等)或两位数字(02、12)组成,但不能为零(00 或 0)。日的正则表达式应显示为:((|0)[1-9])|([1|2][0-9])|(30)|(31)。

月的正则表达式应显示为:((|0)[1-9])|(10)|(11)|(12)。

年的正则表达式应显示为:([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])。

现在,我们需要将所有这些组合起来并用句点隔开数字(如 1.03.1999)。句点也是正则表达式符号,所以必须在前面添加反斜线 (\)。因此,完整日期的正则表达式应显示为:

((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

电子邮件地址的正则表达式:

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

14.01.2020 17:26:22


Please leave your feedback about this article