정규식

아래 표에는 사용자 지정 언어 에 대한 사전을 만드는 데 사용할 수 있는 정규식이 나열되어 있습니다.

항목 이름 기존 정규식 기호 사용 예 및 설명
임의 문자 . c.t — "cat", "cot" 등을 나타냅니다.
그룹에 속하는 문자 []

[b-d]ell — "bell", "cell", "dell" 등을 나타냅니다.

[ty]ell — "tell" 및 "yell"을 나타냅니다.

그룹에 속하지 않는 문자 [^]

[^y]ell — "dell", "cell", "tell"을 나타내지만 "yell"은 금지합니다.

[^n-s]ell — "bell", "cell"을 나타내지만 "nell", "oell", "pell", "qell", "rell" 및 "sell"은 금지합니다.

또는 | c(a|u)t — "cat" 및 "cut"을 나타냅니다.
0개 이상 일치 * 10* — 1, 10, 100, 1000 등의 숫자를 나타냅니다.
하나 이상의 일치 + 10+ — 10, 100, 1000 등의 숫자를 허용하지만 1은 금지합니다.
문자 또는 숫자 [0-9a-zA-Zа-яА-Я]

[0-9a-zA-Zа-яА-Я] — 모든 단일 문자를 허용합니다.

[0-9a-zA-Zа-яА-Я]+ — 모든 단어를 허용합니다.

라틴 대문자 [A-Z]
라틴 소문자 [a-z]
키릴 대문자 [А-Я]
키릴 소문자 [а-я]
숫자 [0-9]
@ 예약.

참고:

  1. 정규식 기호를 일반 문자로 사용하려면 백슬래시를 앞에 추가합니다. 예를 들어, [t-v]x+는 tx, txx, txx 등이나 ux, uxx 등을 나타내지만 \[t-v\]x+는 [t-v]x, [t-v]xx, [t-v]xxx 등을 나타냅니다.
  2. 정규식 요소를 그룹화하려면 괄호를 사용합니다. 예를 들어, (a|b)+|c는 c 또는 abbbaaabbb, ababab 등과 같은 조합(임의 수의 a와 b가 임의 순서대로 나타나며 길이가 0이 아닌 단어)을 나타내고 a|b+|c는 a, c 및 b, bb, bbb 등을 나타냅니다.

세 개 열(생년월일, 이름 및 전자 메일 주소)로 구성되는 표를 인식하는 것으로 가정합니다. 이러한 경우 두 가지 새 언어, 데이터와 주소를 만들고 해당 언어에 대한 다음 정규식을 지정할 수 있습니다.

날짜 정규식:

일을 나타내는 숫자는 한 자리 숫자(1, 2 등) 또는 두 자리 숫자(02, 12)로 구성될 수 있지만 0(00 또는 0)은 될 수 없습니다. 일 정규식의 올바른 표시는 다음과 같습니다: ((|0)[1-9])|([1|2][0-9])|(30)|(31).

월 정규식의 올바른 표시는 다음과 같습니다: ((|0)[1-9])|(10)|(11)|(12).

연도 정규식의 올바른 표시는 다음과 같습니다: ([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9]).

이를 모두 결합하고 숫자는 마침표로 구분하기만 하면 됩니다(예: 1.03.1999). 마침표는 정규식 기호이므로 백슬래시(\)를 앞에 추가해야 합니다.

전체 날짜 정규식의 올바른 표시는 다음과 같습니다:

((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

전자 메일 주소 정규식:

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

02.11.2018 16:19:44

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.