Regulare Ausdrucke

In der folgenden Tabelle sind die regulären Ausdrücke aufgelistet, die zur Erstellung eines neuen Wörterbuchs einer benutzerdefinierten Sprache verwendet werden können.

Objektname Gebräuchliches Symbol eines regulären Ausdrucks Verwendungsbeispiele und Erklärungen
Alle Zeichen . c.t — steht für "cat," "cot," etc.
Zeichen aus einer Gruppe []

[b-d]ell — steht für "bell," "cell," "dell," etc.

[ty]ell — steht für "tell" und "yell"

Zeichen außerhalb einer Gruppe [^]

[^y]ell — steht für "dell," "cell," "tell," schließt jedoch "yell" aus

[^n-s]ell — steht für "bell," "cell," schließt jedoch "nell," "oell," "pell," "qell," "rell," und "sell" aus

Oder | c(a|u)t — steht für "cat" und "cut"
0 oder mehr Übereinstimmungen * 10* — steht für die Zahlen 1, 10, 100, 1000 etc.
1 oder mehr Übereinstimmungen + 10+ — erlaubt Zahlen wie 10, 100, 1000 etc., schließt jedoch die 1 aus
Buchstabe oder Zahl [0-9a-zA-Zа-яА-Я]

[0-9a-zA-Zа-яА-Я] — erlaubt jedes Einzelzeichen

[0-9a-zA-Zа-яА-Я]+ — erlaubt jedes Wort

Lateinischer Großbuchstabe [A-Z]
Lateinischer Kleinbuchstabe [a-z]
Kyrillischer Großbuchstabe [А-Я]
Kyrillischer Kleinbuchstabe [а-я]
Zahl [0-9]
@ Reserviert.

Hinweis:

  1. Um ein Symbol eines regulären Ausdrucks als normales Zeichen zu verwenden, stellen Sie ihm einen umgekehrten Schrägstrich voran. Zum Beispiel steht [t-v]x+ für tx, txx, txx etc., ux, uxx etc., aber \[t-v\]x+ steht für [t-v]x, [t-v]xx, [t-v]xxx etc.
  2. Zum Gruppieren der Elemente regulärer Ausdrücke verwenden Sie Klammern. Zum Beispiel steht (a|b)+|c für c oder jede Kombination, wie abbbaaabbb, ababab etc. (ein Wort mit einer Länge ungleich null, in der u. U. eine Zahl mit a's und b's in einer beliebigen Reihenfolge stehen kann), während a|b+|c für a, c, und b, bb, bbb etc. steht.

Beispiele

Angenommen, Sie erkennen eine Tabelle mit drei Spalten: Datumsangaben für Geburtstage, Namen und E-Mail-Adressen. In diesem Fall können Sie zwei neue Sprachen, Daten und Adresse, erstellen und den folgenden regulären Ausdruck für diese festlegen.

Reguläre Ausdrücke für Datumsangaben:

Zahlen, die für einen Tag stehen, können aus einer Ziffer (1, 2 etc.) oder zwei Ziffern (02, 12) bestehen, jedoch kann keine Null stehen (00 oder 0). Der reguläre Ausdruck für einen Tag sollte dann folgendermaßen aussehen: ((|0)[1-9])|([1|2][0-9])|(30)|(31).

Der reguläre Ausdruck für den Monat sollte dann folgendermaßen aussehen: ((|0)[1-9])|(10)|(11)|(12).

Der reguläre Ausdruck für das Jahr sollte dann folgendermaßen aussehen: ([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9]).

Nun müssen diese Ausdrücke nur noch miteinander kombiniert werden, wobei die Zahlen durch Punkte getrennt werden (z. B. 1.03.1999). Der Punkt ist ein Symbol des regulären Ausdrucks, daher muss ihm ein umgekehrter Schrägstrich (\) vorangestellt werden.

Der reguläre Ausdruck für das vollständige Datum sollte dann folgendermaßen aussehen:

((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

Regulärer Ausdruck für E-Mail-Adressen:

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

17.05.2023 7:34:35

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.