正規表現
下の表は カスタムの言語 の辞書を作成するために使用できる正規表現を一覧にしたものです。
アイテム名 | 従来の正規表現記号 | 使用例と説明 |
任意の文字 | . | c.t — 「cat」、「cot」などを表す |
グループ内の文字 | [] |
[b-d]ell — 「bell」、「cell」、「dell」などを表す [ty]ell — 「tell」および「yell」を表す |
グループ内にない文字 | [^] |
[^y]ell — 「dell」、「cell」、「tell」を表すが、「yell」は禁止 [^n-s]ell — 「bell」、「cell」を表すが、「nell」、「oell」、「pell」、「qell」、「rell」および「sell」は禁止 |
または | | | c(a|u)t — 「cat」および「cut」を表す |
0 以上の一致 | * | 10* — 1、10、100、1000 などの数を表す |
1 以上の一致 | + | 10+ — 10、100、1000 などは許可するが、1 は禁止 |
文字または数字 | [0-9a-zA-Zа-яА-Я] |
[0-9a-zA-Zа-яА-Я] — 任意の 1 文字を許可 [0-9a-zA-Zа-яА-Я]+ — 任意の単語を許可 |
大文字のラテン文字 | [A-Z] | |
小文字のラテン文字 | [a-z] | |
大文字のキリル文字 | [А-Я] | |
小文字のキリル文字 | [а-я] | |
数字 | [0-9] | |
@ | 予備 |
注意
- 正規表現記号を通常の文字として使用するには、前にバックスラッシュを付けます。例えば、[t-v]x+ は tx、txx、txx など、ux、uxx などを表しますが、\[t-v\]x+ は [t-v]x、[t-v]xx、[t-v]xxx などを表します。
- 正規表現の要素をグループ化するには、かっこを使用します。例えば、(a|b)+|c は c または abbbaaabbb、ababab などの任意の組み合わせ (長さがゼロではなく、任意の数の a および b が任意の順序で並んでいる単語) を表しますが、a|b+|c は a、c、および b、bb、bbb などを表します。
例
生年月日、名前、電子メール アドレスの 3 列からなる表を認識するとします。この場合、日付とアドレスの 2 つの新しい言語を作成し、それらに以下の正規表現を設定することができます。
日付の正規表現
日を表す数は 1 桁の数字 (1、2、など) または 2 桁の数字 (02、12) で構成できますが、ゼロ (00 または 0) にはできません。したがって、日の正規表現は次のようになります: ((|0)[1-9])|([1|2][0-9])|(30)|(31)。
月の正規表現は次のようになります: ((|0)[1-9])|(10)|(11)|(12)。
年の正規表現は次のようになります: ([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])。
この後するべきことは、これらをすべて組み合わせて、数字をピリオドで区切るだけです (1.03.1999 など)。ピリオドは正規表現記号であるため、前にバックスラッシュ (\) を付ける必要があります。
日付全体の正規表現は、次のようになります:
((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])
電子メール アドレスの正規表現
[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+
3/26/2024 1:49:51 PM