Regulární výrazy

Níže uvedená tabulka uvádí regulární výrazy, které lze použít k vytvoření slovníku uživatelského jazyka.

Poznámka:

  1. Chcete-li používat znak regulárního výrazu jako běžný znak, napište před něj zpětné lomítko. Například [t-v]x+ zastupuje tx, txx, txx, atd., ux, uxx atd., ale \[t-v\]x+ zastupuje [t-v]x, [t-v]xx, [t-v]xxx atd.
  2. Chcete-li prvky regulárního výrazu seskupit, použijte závorky. Například (a|b)+|c zastupuje c nebo libovolnou kombinaci jako např. abbbaaabbb, ababab atd. (slovo určité nenulové délky, ve kterém může být libovolný počet písmen a nebo b v libovolném pořadí), zatímco a|b+|c zastupuje a, c a b, bb, bbb atd.

Příklady

Předpokládejme, že rozpoznáváte tabulku se třemi sloupci: daty narození, jmény a e-mailovými adresami. V tomto případě můžete vytvořit dva nové jazyky, datum a adresu, a zadat pro ně následující regulární výrazy.

Regulární výrazy kalendářních dat:

Číslo označující den může obsahovat jednu číslici (1, 2 atd.) nebo dvě číslice (02, 12), nesmí však být nula (00 nebo 0). Regulární výraz dne by měl vypadat takto: ((|0)[1-9])|([1|2][0-9])|(30)|(31).

Regulární výraz měsíce by měl vypadat takto: ((|0)[1-9])|(10)|(11)|(12).

Regulární výraz roku by měl vypadat takto: ([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9]).

Nakonec ještě zbývá zkombinovat vše dohromady a oddělit čísla tečkami (např. 1.03.1999). Tečka je znak regulárního symbolu, takže před ni musíte napsat zpětné lomítko (\). Regulární výraz celého data by měl vypadat takto:

((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

Regulární výraz e-mailové adresy:

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

14.01.2020 17:26:18

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.