Espressioni regolari

Nella tabella di seguito sono elencate le espressioni regolari utilizzabili per creare un dizionario per una lingua personalizzata.

Nome elemento Simbolo espressione regolare convenzionale Spiegazioni ed esempi di utilizzo
Qualsiasi carattere . c.t — indica "cat", "cot" e così via
Carattere da gruppo []

[b-d]ell — indica "bell", "cell", "dell" e così via

[ty]ell — indica "tell" e "yell"

Carattere non da gruppo [^]

[^y]ell — indica "dell", "cell", "tell", ma esclude "yell"

[^n-s]ell — indica "bell", "cell", ma esclude "nell", "oell", "pell", "qell", "rell" e "sell"

Oppure | c(a|u)t — indica "cat" e "cut"
0 o più corrispondenze * 10* — indica numeri come 1, 10, 100, 1.000 e così via
una o più corrispondenze + 10+ — consente numeri come 10, 100, 1.000 e così via, ma esclude 1
Lettera o numero [0-9a-zA-Zа-яА-Я]

[0-9a-zA-Zа-яА-Я] — consente qualsiasi singolo carattere

[0-9a-zA-Zа-яА-Я]+ — consente qualsiasi parola

Lettera maiuscola latina [A-Z]
Lettera minuscola latina [a-z]
Lettera maiuscola cirillica [А-Я]
Lettera minuscola cirillica [а-я]
Cifra [0-9]
@ Riservato.

Nota.

  1. Per poter utilizzare un simbolo di espressione regolare come carattere normale, è necessario che sia preceduto da una barra rovesciata. Ad esempio, [t-v]x+ indica tx, txx, txx e così via, ux, uxx e così via, ma \[t-v\]x+ indica [t-v]x, [t-v]xx, [t-v]xxx e così via.
  2. Per raggruppare elementi di espressione regolari, usare le parentesi. Ad esempio, (a|b)+|c indica una lettera "c" o qualsiasi combinazione come abbbaaabbb, ababab e così via (una parola di lunghezza diversa da zero contenente qualsiasi numero di lettere "a" e "b" in qualsiasi ordine), mentre a|b+|c indica a, c, b, bb, bbb e così via.

Esempi

Si sta eseguendo il riconoscimento di una tabella con tre colonne: data di nascita, nome e indirizzo e-mail. In questo caso è possibile creare due nuove lingue, dati e indirizzi, e impostare le seguenti espressioni regolari corrispondenti.

Espressione regolare per le date:

Il numero che indica un giorno può essere composto da una cifra (1, 2 e così via) o da due cifre (02, 12), ma non può essere uguale a zero (00 oppure 0). L'espressione regolare per il giorno dovrà quindi avere la seguente struttura: ((|0)[1-9])|([1|2][0-9])|(30)|(31).

L'espressione regolare per il mese dovrà avere la seguente struttura: ((|0)[1-9])|(10)|(11)|(12).

L'espressione regolare per l'anno dovrà avere la seguente struttura: ([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9]).

Basta quindi combinare tra loro questi elementi e separare i numeri mediante punti (ad esempio: 1.03.1999). Il punto è un simbolo di espressione regolare, quindi deve essere preceduto da una barra rovesciata (\).

L'espressione regolare per la data completa dovrà quindi avere la seguente struttura:

((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

Espressione regolare per gli indirizzi e-mail:

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

11/2/2018 4:19:28 PM

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.