Expressoes regulares

A tabela abaixo lista as expressões regulares que podem ser usadas para criar um dicionário para um idioma personalizado.

Nome do item Símbolo da expressão regular convencional Exemplos e explicações sobre o uso
Qualquer caractere . c.t — denota "cat," "cot," etc.
Caractere do grupo []

[b-d]ell — denota "bell," "cell," "dell," etc.

[ty]ell — denota "tell" e "yell"

Caractere não pertencente ao grupo [^]

[^y]ell — denota "dell," "cell," "tell," mas proíbe "yell"

[^n-s]ell — denota "bell," "cell," but forbids "nell," "oell," "pell," "qell," "rell," e "sell"

Ou | c(a|u)t — denota "cat" e "cut"
0 ou mais correspondências * 10* — denota os números 1, 10, 100, 1000, etc.
1 ou mais correspondências + 10+ — permite números 10, 100, 1000, etc., mas proíbe 1
Letra ou dígito [0-9a-zA-Zа-яА-Я]

[0-9a-zA-Zа-яА-Я] — permite qualquer caractere único

[0-9a-zA-Zа-яА-Я] — permite qualquer palavra

Letra maiúscula latina [A-Z]
Letra minúscula latina [a-z]
Letra cirílica maiúscula [А-Я]
Letra cirílica minúscula [а-я]
Dígito [0-9]
@ Reservado.

Observação:

  1. Para usar um símbolo de expressão regular como um caractere normal, insira uma barra invertida antes do símbolo. Por exemplo, [t-v]x+ indica tx, txx, txx, etc, ux, uxx, etc, mas \[t-v\]x+ indica [t-v]x, [t-v]xx, [t-v]xxx, etc.
  2. Para agrupar elementos de expressões regulares, use parênteses. Por exemplo, (a|b)+|c indica c e qualquer combinação como abbbaaabbb, ababab, etc (uma palavra com um comprimento diferente de zero na qual pode haver um número qualquer de a's e b's em qualquer ordem), enquanto a|b+|c indica a, c, e b, bb, bbb, etc.

Exemplos

Vamos supor que você está reconhecendo uma tabela com três colunas: datas de aniversário, nomes e endereços de e-mail. Nesse caso, você pode criar dois novos idiomas, Data e Endereço, e especificar as seguintes expressões regulares para eles.

Expressão regular para datas:

O número que denota o dia pode consistir em um dígito (1, 2, etc) ou dois dígitos (02, 12), mas não pode ser zero (00 ou 0). A expressão regular para o dia deve ter a seguinte aparência: ((|0)[1-9])|([1|2][0-9])|(30)|(31).

A expressão regular para o mês deve ter a seguinte aparência: ((|0)[1-9])|(10)|(11)|(12).

A expressão regular para o ano deve ter a seguinte aparência: ([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9]).

Agora tudo o que precisamos fazer é combinar as informações e separar os números por pontos (por exemplo, 1.03.1999). O ponto é um símbolo de expressão regular. Portanto, você deve inserir uma barra invertida (\) antes de cada um.

A expressão regular para a data completa deve ser assim:

((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

Expressão regular para endereços de e-mail:

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

11/2/2018 4:19:50 PM


Please leave your feedback about this article