Reguliere expressies

De onderstaande tabel toont de reguliere expressies die kunnen worden gebruikt om een woordenboek voor een aangepaste taal te maken.

Naam van het item Standaardsymbool voor reguliere expressie Gebruiksvoorbeelden en uitleg
Willekeurig teken . k.t — staat voor ‘kat’, ‘kot’ enz.
Teken uit groep []

[b-d]el — staat voor ‘bel’, ‘cel’, ‘del’ enz.

[bw]erk — staat voor ‘berk’ en ‘werk’

Teken niet uit groep [^]

[^d]el — staat voor ‘bel’, ‘cel’ enz. maar verbiedt ‘del’

[^d-i]el — staat voor ‘bel’ en ‘cel’ maar verbiedt ‘del’ ‘fel’ ‘gel’ ‘hel’ en ‘iel’

Of | k(a|o)t — staat voor ‘kat’ en ‘kot’
0 of meer overeenkomsten * 10* — staat voor 1, 10, 100, 1000 enz.
1 of meer overeenkomsten + 10+ — staat voor 10, 100, 1000 enz. maar verbiedt 1
Letter of cijfer [0-9a-zA-Zа-яА-Я]

[0-9a-zA-Zа-яА-Я] — staat elk teken toe

[0-9a-zA-Zа-яА-Я]+ — staat elk woord toe

Latijnse hoofdletter [A-Z]
Latijnse kleine letter [a-z]
Cyrillische hoofdletter [А-Я]
Cyrillische kleine letter [а-я]
Cijfer [0-9]
@ Gereserveerd.

Opmerking:

  1. Als u een symbool dat binnen reguliere expressies een speciale betekenis heeft, als een normaal teken wilt gebruiken, plaatst u er een backslash voor. Bijvoorbeeld,  [t-v]x+ staat voor tx, txx, txx, enz., ux, uxx, enz., maar \[t-v\]x+ staat voor [t-v]x, [t-v]xx, [t-v]xxx, enz.
  2. U kunt elementen uit reguliere expressies groeperen met behulp van haakjes. Bijvoorbeeld, (a|b)+|c staat voor c of om het even welke combinatie zoals abbbaaabbb, ababab, enz. (een woord van om het even welke lengte die niet gelijk is aan nul, en waarin a en b in om het even welke volgorde kunnen voorkomen), terwijl a|b+|c staat voor a, c, en b, bb, bbb, enz.

Voorbeelden

Stel dat u een tabel herkent met drie kolommen: geboortedatums, namen en e-mailadressen. In dit geval kunt u twee nieuwe talen maken (datums en adressen) en de volgende reguliere expressies ervoor specificeren.

Reguliere expressies voor datums:

Het nummer dat voor een dag staat kan uit één cijfer (1, 2 enz.) of twee cijfers (02, 12) bestaan, maar kan niet nul (0 of 00) zijn. De reguliere expressie voor de dag hoort er dus als volgt uit te zien: ((|0)[1-9])|([1|2][0-9])|(30)|(31).

De reguliere expressie voor de maand hoort er als volgt uit te zien: ((|0)[1-9])|(10)|(11)|(12).

De reguliere expressie voor het jaar hoort er als volgt uit te zien: ([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9]).

Alles wat u nog moet doen is dit allemaal combineren en de nummers onderling door een punt scheiden (zoals in 1.03.1999). De punt wordt ook voor het vormen van reguliere expressies gebruikt, dus moet u er een backslash (\) voor plaatsen. De reguliere expressie voor de volledige datum hoort er dus als volgt uit te zien:

((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

Reguliere expressie voor een e-mailadres:

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

02.11.2018 16:19:46

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.