Almindelige udtryk

Tabellen nedenfor viser de almindelige udtryk, der kan anvendes til at oprette en ordbog for et brugerdefineret sprog.

Enhedsnavn Traditionelt almindeligt udtrykssymbol Anvendelseseksempler og forklaringer
Ethvert tegn . c.t — betyder "cat," "cot," osv.
Tegn fra gruppe []

[b-d]ell — betyder "bell," "cell," "dell," etc.

[ty]ell — betyder "tell" and "yell"

Tegn ikke fra gruppe [^]

[^y]ell — betyder "dell," "cell," "tell," men forbyder "yell"

[^n-s]ell — betyder "bell," "cell," men forbyder "nell," "oell," "pell," "qell," "rell," and "sell"

Eller | c(a|u)t — betyder "cat" and "cut"
0 eller flere match * 10* — betyder tallene 1, 10, 100, 1000, osv.
1 eller flere match + 10+ — tillader tallene 10, 100, 1000, osv., men forbyder 1
Bogstav eller ciffer [0-9a-zA-Zа-яА-Я]

[0-9a-zA-Zа-яА-Я] — tillader alle enkelte tegn

[0-9a-zA-Zа-яА-Я]+ — tillader alle ord

Stort latinsk bogstav [A-Z]
Lille latinsk bogstav [a-z]
Stort kyrillisk bogstav [А-Я]
Lille kyrillisk bogstav [а-я]
Ciffer [0-9]
@ Reserveret.

Bemærk:

  1. For at anvende almindelige udtrykssymboler som normale tegn, skal det forsynes med en backslash. For eksempel, [t-v]x+ står for tx, txx, txx, osv., ux, uxx, osv., men \[t-v\]x+ står for [t-v]x, [t-v]xx, [t-v]xxx, osv.
  2. For at gruppere almindelige elementer anvendes parenteser. For eksempel, (a|b)+|c står for c eller alle kombinationer som abbbaaabbb, ababab, mv. (et ord af enhver ikke-nul længde, i hvilket der kan være alle antal af a’er og b’er i enhver rækkefølge), mens a|b+|c står for a, c, og b, bb, bbb, mv.

Eksempler

Lad os antage, at du genkender en tabel med tre kolonner: fødselsdatoer, navne og e-mail adresser. I dette tilfælde kan du oprette to nye sprog, data og adresser og specificere følgende almindelige udtryk for dem.

Almindeligt udtryk for datoer:

Antallet af betydninger for en dag, kan bestå af et ciffer (1,2, mv.) eller to cifre (02, 12), men det kan ikke være nul (00 eller 0). Det almindelige udtryk for dagen, skal se ud som dette: ((|0)[1-9])|([1|2][0-9])|(30)|(31).

Det almindelige udtryk for måneden, skal se ud som dette: ((|0)[1-9])|(10)|(11)|(12).

Det almindelige udtryk for året, skal se ud som dette: ([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9]).

Nu skal vi bare have kombinerer alt dette sammen og separere numrene med punktum (som 1.03.1999). Perioden er et almindeligt udtrykssymbol, så du skal indsætte et backslash (\) før dette. Det almindelige udtryk for den komplette dato, skal så se ud som dette:

((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

Almindeligt udtryk for e-mail adresser:

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

11/2/2018 4:19:14 PM

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.