正規表現

下の表はカスタムの言語の辞書を作成するために使用できる正規表現を一覧にしたものです。

注意

  1. 正規表現記号を通常の文字として使用するには、前にバックスラッシュを付けます。例えば、[t-v]x+ は tx、txx、txx など、ux、uxx などを表しますが、\[t-v\]x+ は [t-v]x、[t-v]xx、[t-v]xxx などを表します。
  2. 正規表現の要素をグループ化するには、かっこを使用します。例えば、(a|b)+|c は c または abbbaaabbb、ababab などの任意の組み合わせ (長さがゼロではなく、任意の数の a および b が任意の順序で並んでいる単語) を表しますが、a|b+|c は a、c、および b、bb、bbb などを表します。

生年月日、名前、電子メール アドレスの 3 列からなる表を認識するとします。この場合、日付とアドレスの 2 つの新しい言語を作成し、それらに以下の正規表現を設定することができます。

日付の正規表現

日を表す数は 1 桁の数字 (1、2、など) または 2 桁の数字 (02、12) で構成できますが、ゼロ (00 または 0) にはできません。したがって、日の正規表現は次のようになります: ((|0)[1-9])|([1|2][0-9])|(30)|(31)。

月の正規表現は次のようになります: ((|0)[1-9])|(10)|(11)|(12)。

年の正規表現は次のようになります: ([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])。

この後するべきことは、これらをすべて組み合わせて、数字をピリオドで区切るだけです (1.03.1999 など)。ピリオドは正規表現記号であるため、前にバックスラッシュ (\) を付ける必要があります。日付全体の正規表現は、次のようになります:

((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

電子メール アドレスの正規表現

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

14.01.2020 17:26:20

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.