Expressions ordinaires
Le tableau ci-dessous répertorie les expressions normales qui peuvent être utilisées pour créer un dictionnaire pour une langue personnalisée.
Nom de l'élément | Symbole conventionnel de l'expression régulière | Exemples d'utilisation et explications |
Tout caractère | . | c.t — distingue « cat, » « cot, » etc. |
Caractère du groupe | [] |
[b-d]ell — distingue « bell, » « cell, » « dell, » etc. [ty]ell — distingue « tell » et « yell » |
Caractère hors groupe | [^] |
[^y]ell — distingue « dell, » « cell, » « tell, » mais interdit « yell » [^n-s]ell — distingue « bell, » « cell, » mais interdit « nell, » « oell, » « pell, » « qell, » « rell, » et « sell » |
Ou | | | c(a|u)t — distingue « cat » et « cut » |
0 ou plusieurs correspondances | * | 10* — distingue les nombres 1, 10, 100, 1000, etc. |
1 ou plusieurs correspondances | + | 10+ — autorise les nombres 10, 100, 1000, etc, mais interdit 1 |
Lettre ou chiffre | [0-9a-zA-Zа-яА-Я] |
[0-9a-zA-Zа-яА-Я] — autorise tout caractère [0-9a-zA-Zа-яА-Я]+ — autorise tout mot |
Lettre latine majuscule | [A-Z] | |
Lettre latine minuscule | [a-z] | |
Lettre cyrillique majuscule | [А-Я] | |
Lettre cyrillique minuscule | [а-я] | |
Chiffre | [0-9] | |
@ | Réservé. |
Remarque :
- pour utiliser un symbole d'expression régulière comme caractère standard, faites-le précéder d'une barre oblique inversée. Par exemple, [t-v]x+ désigne tx, txx, txx, etc., ux, uxx, etc., mais \[t-v\]x+ désigne [t-v]x, [t-v]xx, [t-v]xxx, etc.
- Pour regrouper des éléments d'expressions régulières, utilisez des parenthèses. Par exemple, (a|b)+|c désigne c ou toute combinaison telle que abbbaaabbb, ababab, etc. (un mot de longueur non nulle dans lequel il peut y avoir n'importe quel nombre de a et de b et dans quelqu'ordre que ce soit) tandis que a|b+|c désigne a, c et b, bb, bbb, etc.
Exemples
Supposez que vous reconnaissez un tableau comportant trois colonnes : dates d'anniversaire, noms et adresses électroniques. Dans ce cas, vous pouvez créer deux nouvelles langues, Données et adresse, et indiquer les expressions normales suivantes pour celles-ci.
Expression régulière pour les dates :
Le numéro indiquant le jour peut comporter un chiffre (par exemple 1, 2, etc.) ou deux (par exemple, 02, 12), mais ne peut pas avoir une valeur nulle (00 ou 0). L'expression régulière du jour se présentera alors sous la forme suivante : ((|0)[1-9])|([1|2][0-9])|(30)|(31).
L'expression régulière du mois se présentera alors sous la forme suivante : ((|0)[1-9])|(10)|(11)|(12).
L'expression régulière de l'année se présentera alors sous la forme suivante : ([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9]).
Maintenant, tout ce qu'il nous reste à faire, c'est associer l'ensemble et séparer les numéros par des points (par ex. : 1.03.1999). Le point est un symbole d'expression régulière ; c'est pourquoi vous devez le faire précéder d'une barre oblique inversée (\).
L'expression régulière de la date complète se présentera alors sous la forme suivante :
((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])
Expression normale pour les adresses électroniques :
[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+
3/26/2024 1:49:50 PM