Regulare Ausdrucke
In der folgenden Tabelle sind die regulären Ausdrücke aufgelistet, die zur Erstellung eines neuen Wörterbuchs einer benutzerdefinierten Sprache verwendet werden können.
Objektname | Gebräuchliches Symbol eines regulären Ausdrucks | Verwendungsbeispiele und Erklärungen |
Alle Zeichen | . | c.t — steht für "cat," "cot," etc. |
Zeichen aus einer Gruppe | [] |
[b-d]ell — steht für "bell," "cell," "dell," etc. [ty]ell — steht für "tell" und "yell" |
Zeichen außerhalb einer Gruppe | [^] |
[^y]ell — steht für "dell," "cell," "tell," schließt jedoch "yell" aus [^n-s]ell — steht für "bell," "cell," schließt jedoch "nell," "oell," "pell," "qell," "rell," und "sell" aus |
Oder | | | c(a|u)t — steht für "cat" und "cut" |
0 oder mehr Übereinstimmungen | * | 10* — steht für die Zahlen 1, 10, 100, 1000 etc. |
1 oder mehr Übereinstimmungen | + | 10+ — erlaubt Zahlen wie 10, 100, 1000 etc., schließt jedoch die 1 aus |
Buchstabe oder Zahl | [0-9a-zA-Zа-яА-Я] |
[0-9a-zA-Zа-яА-Я] — erlaubt jedes Einzelzeichen [0-9a-zA-Zа-яА-Я]+ — erlaubt jedes Wort |
Lateinischer Großbuchstabe | [A-Z] | |
Lateinischer Kleinbuchstabe | [a-z] | |
Kyrillischer Großbuchstabe | [А-Я] | |
Kyrillischer Kleinbuchstabe | [а-я] | |
Zahl | [0-9] | |
@ | Reserviert. |
Hinweis:
- Um ein Symbol eines regulären Ausdrucks als normales Zeichen zu verwenden, stellen Sie ihm einen umgekehrten Schrägstrich voran. Zum Beispiel steht [t-v]x+ für tx, txx, txx etc., ux, uxx etc., aber \[t-v\]x+ steht für [t-v]x, [t-v]xx, [t-v]xxx etc.
- Zum Gruppieren der Elemente regulärer Ausdrücke verwenden Sie Klammern. Zum Beispiel steht (a|b)+|c für c oder jede Kombination, wie abbbaaabbb, ababab etc. (ein Wort mit einer Länge ungleich null, in der u. U. eine Zahl mit a's und b's in einer beliebigen Reihenfolge stehen kann), während a|b+|c für a, c, und b, bb, bbb etc. steht.
Beispiele
Angenommen, Sie erkennen eine Tabelle mit drei Spalten: Datumsangaben für Geburtstage, Namen und E-Mail-Adressen. In diesem Fall können Sie zwei neue Sprachen, Daten und Adresse, erstellen und den folgenden regulären Ausdruck für diese festlegen.
Reguläre Ausdrücke für Datumsangaben:
Zahlen, die für einen Tag stehen, können aus einer Ziffer (1, 2 etc.) oder zwei Ziffern (02, 12) bestehen, jedoch kann keine Null stehen (00 oder 0). Der reguläre Ausdruck für einen Tag sollte dann folgendermaßen aussehen: ((|0)[1-9])|([1|2][0-9])|(30)|(31).
Der reguläre Ausdruck für den Monat sollte dann folgendermaßen aussehen: ((|0)[1-9])|(10)|(11)|(12).
Der reguläre Ausdruck für das Jahr sollte dann folgendermaßen aussehen: ([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9]).
Nun müssen diese Ausdrücke nur noch miteinander kombiniert werden, wobei die Zahlen durch Punkte getrennt werden (z. B. 1.03.1999). Der Punkt ist ein Symbol des regulären Ausdrucks, daher muss ihm ein umgekehrter Schrägstrich (\) vorangestellt werden.
Der reguläre Ausdruck für das vollständige Datum sollte dann folgendermaßen aussehen:
((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])
Regulärer Ausdruck für E-Mail-Adressen:
[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+
3/26/2024 1:49:48 PM