Expressoes regulares

Download

A tabela abaixo lista as expressões regulares que podem ser usadas para criar um dicionário para um idioma personalizado.

Nome do item Símbolo da expressão regular convencional Exemplos e explicações sobre o uso
Qualquer caractere . c.t — denota "cat," "cot," etc.
Caractere do grupo []

[b-d]ell — denota "bell," "cell," "dell," etc.

[ty]ell — denota "tell" e "yell"

Caractere não pertencente ao grupo [^]

[^y]ell — denota "dell," "cell," "tell," mas proíbe "yell"

[^n-s]ell — denota "bell," "cell," but forbids "nell," "oell," "pell," "qell," "rell," e "sell"

Ou | c(a|u)t — denota "cat" e "cut"
0 ou mais correspondências * 10* — denota os números 1, 10, 100, 1000, etc.
1 ou mais correspondências + 10+ — permite números 10, 100, 1000, etc., mas proíbe 1
Letra ou dígito [0-9a-zA-Zа-яА-Я]

[0-9a-zA-Zа-яА-Я] — permite qualquer caractere único

[0-9a-zA-Zа-яА-Я] — permite qualquer palavra

Letra maiúscula latina [A-Z]
Letra minúscula latina [a-z]
Letra cirílica maiúscula [А-Я]
Letra cirílica minúscula [а-я]
Dígito [0-9]
@ Reservado.

Observação:

  1. Para usar um símbolo de expressão regular como um caractere normal, insira uma barra invertida antes do símbolo. Por exemplo, [t-v]x+ indica tx, txx, txx, etc, ux, uxx, etc, mas \[t-v\]x+ indica [t-v]x, [t-v]xx, [t-v]xxx, etc.
  2. Para agrupar elementos de expressões regulares, use parênteses. Por exemplo, (a|b)+|c indica c e qualquer combinação como abbbaaabbb, ababab, etc (uma palavra com um comprimento diferente de zero na qual pode haver um número qualquer de a's e b's em qualquer ordem), enquanto a|b+|c indica a, c, e b, bb, bbb, etc.

Exemplos

Vamos supor que você está reconhecendo uma tabela com três colunas: datas de aniversário, nomes e endereços de e-mail. Nesse caso, você pode criar dois novos idiomas, Data e Endereço, e especificar as seguintes expressões regulares para eles.

Expressão regular para datas:

O número que denota o dia pode consistir em um dígito (1, 2, etc) ou dois dígitos (02, 12), mas não pode ser zero (00 ou 0). A expressão regular para o dia deve ter a seguinte aparência: ((|0)[1-9])|([1|2][0-9])|(30)|(31).

A expressão regular para o mês deve ter a seguinte aparência: ((|0)[1-9])|(10)|(11)|(12).

A expressão regular para o ano deve ter a seguinte aparência: ([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9]).

Agora tudo o que precisamos fazer é combinar as informações e separar os números por pontos (por exemplo, 1.03.1999). O ponto é um símbolo de expressão regular. Portanto, você deve inserir uma barra invertida (\) antes de cada um.

A expressão regular para a data completa deve ser assim:

((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

Expressão regular para endereços de e-mail:

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

3/4/2022 7:13:24 AM

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.