Regulaaravaldised

Järgmises tabelis on esitatud regulaaravaldised, mida saab kasutada sõnastiku loomisel kohandatud keele jaoks.

Märkus.

  1. Regulaaravaldise sümboli kasutamiseks tavalise märgina sisesta selle ette kurakriips. Nt [t-v]x+ on tx, txx, txx, jne või ux, uxx jne, kuid \[t-v\]x+ on [t-v]x, [t-v]xx, [t-v]xxx jne,
  2. Regulaaravaldiste elementide rühmitamiseks kasuta sulgusid. Nt (a|b)+|c on c või suvaline kombinatsioon abbbaaabbb, ababab jne (sõna, mis on pikem kui 0 tähemärki, võib sisaldada suvalises järjestuses suvalise arvu a-sid ja b-sid), a|b+|c on aga a, c, ja b, bb, bbb jne.

Näited

Oled tuvastamas kolme veeruga tabelit: sünnikuupäevad, nimed ja e-posti aadressid. Sellisel juhul saad luua kaks uut keelt, andmed ja aadressi ning määrata nende jaoks järgmised regulaaravaldised.

Kuupäevade regulaaravaldised:

Päeva märkiv number võib koosneda ühest numbrist (1, 2 jne) või kahest numbrist (02, 12), kuid see ei saa olla null (00 või 0). Päeva regulaaravaldis peaks olema siis järgmine: ((|0)[1-9])|([1|2][0-9])|(30)|(31).

Kuu regulaaravaldis peaks olema siis järgmine: ((|0)[1-9])|(10)|(11)|(12).

Aasta regulaaravaldis peaks olema siis järgmine: ([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9]).

Nüüd jääb ainult see kõik kokku panna ja eraldada numbrid punktiga (nt 1.03.1999). Punkt on regulaaravaldise sümbol, seega pead selle ette sisestama kurakriipsu (\). Kuupäeva regulaaravaldis peaks olema siis järgmine:

((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

E-posti aadresside regulaaravaldis:

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

14.01.2020 17:26:19

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.