Expressions ordinaires

Le tableau ci-dessous répertorie les expressions normales qui peuvent être utilisées pour créer un dictionnaire pour une langue personnalisée.

Nom de l'élément Symbole conventionnel de l'expression régulière Exemples d'utilisation et explications
Tout caractère . c.t — distingue « cat, » « cot, » etc.
Caractère du groupe []

[b-d]ell — distingue « bell, » « cell, » « dell, » etc.

[ty]ell — distingue « tell » et « yell »

Caractère hors groupe [^]

[^y]ell — distingue « dell, » « cell, » « tell, » mais interdit « yell »

[^n-s]ell — distingue « bell, » « cell, » mais interdit « nell, » « oell, » « pell,  » « qell, » « rell, » et « sell »

Ou | c(a|u)t — distingue « cat » et « cut »
0 ou plusieurs correspondances * 10* — distingue les nombres 1, 10, 100, 1000, etc.
1 ou plusieurs correspondances + 10+ — autorise les nombres 10, 100, 1000, etc, mais interdit 1
Lettre ou chiffre [0-9a-zA-Zа-яА-Я]

[0-9a-zA-Zа-яА-Я] — autorise tout caractère

[0-9a-zA-Zа-яА-Я]+ — autorise tout mot

Lettre latine majuscule [A-Z]
Lettre latine minuscule [a-z]
Lettre cyrillique majuscule [А-Я]
Lettre cyrillique minuscule [а-я]
Chiffre [0-9]
@ Réservé.

Remarque :

  1. pour utiliser un symbole d'expression régulière comme caractère standard, faites-le précéder d'une barre oblique inversée. Par exemple, [t-v]x+ désigne tx, txx, txx, etc., ux, uxx, etc., mais \[t-v\]x+ désigne [t-v]x, [t-v]xx, [t-v]xxx, etc.
  2. Pour regrouper des éléments d'expressions régulières, utilisez des parenthèses. Par exemple, (a|b)+|c désigne c ou toute combinaison telle que abbbaaabbb, ababab, etc. (un mot de longueur non nulle dans lequel il peut y avoir n'importe quel nombre de a et de b et dans quelqu'ordre que ce soit) tandis que a|b+|c désigne a, c et b, bb, bbb, etc.

Exemples

Supposez que vous reconnaissez un tableau comportant trois colonnes : dates d'anniversaire, noms et adresses électroniques. Dans ce cas, vous pouvez créer deux nouvelles langues, Données et adresse, et indiquer les expressions normales suivantes pour celles-ci.

Expression régulière pour les dates :

Le numéro indiquant le jour peut comporter un chiffre (par exemple 1, 2, etc.) ou deux (par exemple, 02, 12), mais ne peut pas avoir une valeur nulle (00 ou 0). L'expression régulière du jour se présentera alors sous la forme suivante : ((|0)[1-9])|([1|2][0-9])|(30)|(31).

L'expression régulière du mois se présentera alors sous la forme suivante : ((|0)[1-9])|(10)|(11)|(12).

L'expression régulière de l'année se présentera alors sous la forme suivante : ([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9]).

Maintenant, tout ce qu'il nous reste à faire, c'est associer l'ensemble et séparer les numéros par des points (par ex. : 1.03.1999). Le point est un symbole d'expression régulière ; c'est pourquoi vous devez le faire précéder d'une barre oblique inversée (\).

L'expression régulière de la date complète se présentera alors sous la forme suivante :

((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

Expression normale pour les adresses électroniques :

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

26.03.2024 13:49:50

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.