Алфавіт, що використовується в регулярних виразах

Регулярні вирази, які можна використовувати для створення словника мови користувача .

Назва у списку Умовне позначення в полі Приклад використання
Будь-який символ . (крапка) к.т — допускає слова типу «кит», «кіт» тощо.
Символ із групи [] [й-р]от — допускає слова типу «йот», «иот», «кот», «лот», «рот» тощо; [тм]от — допускає слова тот і мот.
Символ не з групи [^] [^т]от — допускає слова «кот», «лот», але не допускає слова «тот»; [^й-к]от — допускає слова «бот», «вот», «рот», але не допускає слова «йот», «кот».
Або | пл(о|а)т — допускає слова «плот» і «плат».
0 або більше збігів * 10* — допускає числа 1, 10, 100, 1000 і т. д.
1 або більше збігів + 10+ — допускає числа 10, 100, 1000 і т. д.
Літера або цифра [0-9a-zA-Zа-яА-Я] [0-9a-zA-Zа-яА-Я] — допускає будь-який одиничний символ; [0-9a-zA-Zа-яА-Я]+ — допускає будь-яке слово
Велика латинська літера [A-Z]
Мала латинська літера [a-z]
Велика кирилична літера [А-Я]
Мала кирилична літера [а-я]
Цифра [0-9]
@ Зарезервовано як службове слово.

Примітка:

  1. Щоб використовувати службові символи не як службові, а як повноцінні, ставте перед ними «зворотний слеш» (\), наприклад [t-v]x+ допускає такі слова, як tx, txx, txxx і т. д., ux, uxx і т. д, vx, vxx і т. д. Вираз \[t-v\]x+ допускає слова [t-v]x, [t-v]xx, [t-v]xxx і т. д.
  2. Для того щоб об’єднати в групу окремі елементи регулярного виразу, можна скористатися дужками. Наприклад, вираз (a|b)+|c допускає літеру c і комбінації літер a та b будь-якої довжини та послідовності (abbbaaabbb, ababab і т. д.), тоді як вираз a|b+|c допускає лише a, c та b, а також комбінації bb, bbb і т. д.

Приклади регулярних виразів

Ви розпізнаєте таблицю, в одній колонці якої написана дата народження, в іншій — прізвище, ім’я та по батькові, а в третьому полі — адреса електронної пошти. Ви можете створити нові мови: Data і Address — і задати для них регулярні вирази.

Для дати:

Число місяця може складатися з однієї цифри (наприклад, 1, 2 і т. д.), з двох цифр (наприклад, 02, 12) і не може бути нульовим (00 або 0). У цьому разі отримуємо такий регулярний вираз для числа: ((|0)[1-9])|([1|2][0-9])|(30)|(31).

Для місяця регулярний вираз має вигляд: ((|0)[1-9])|(10)|(11)|(12).

Для року: ([19][0-9][0-9])|([0-9][0-9]).

Збираючи все разом і враховуючи, що при використанні службових символів не як службових, а як повноцінних потрібно ставити перед ними «зворотний слеш» (\), отримаємо:

((|0)[1-9])|([1|2][0-9])|(30)|(31)\. ((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])

Для електронної пошти:

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

02.11.2018 16:20:06

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.