Expresiones regulares

La tabla que figura a continuación enumera las expresiones regulares que pueden utilizarse para crear un diccionario para un idioma personalizado.

Nombre del elemento Símbolo convencional de la expresión regular Ejemplos de uso y explicaciones
Cualquier carácter . ma.a — denota "masa", "maza", etc.
Carácter de grupo []

[p-y]eso — denota "peso", "seso" "yeso", etc.

[ps]eso — denota "peso" y "seso"

Carácter no de grupo [^]

[^y]eso — denota "peso," "seso," pero prohíbe "yeso"

[^q-y]eso — denota "beso", "peso," pero prohíbe "seso" y "yeso"

O | ma(s|z)a — denota "masa" y "maza"
0 o más coincidencias * 10* — denota los números 1, 10, 100, 1000, etc.
1 o más coincidencias + 10+ — permite los números 10, 100, 1000, etc., pero prohíbe 1
Letra o dígito [0-9a-zA-Zа-яА-Я]

[0-9a-zA-Zа-яА-Я] — permite cualquier carácter único

[0-9a-zA-Zа-яА-Я]+ — permite cualquier palabra

Letra latina mayúscula [A-Z]
Letra latina minúscula [a-z]
Letra cirílica mayúscula [А-Я]
Letra cirílica minúscula [а-я]
Dígito [0-9]
@ Reservado.

Nota:

  1. Para utilizar un símbolo de expresión regular como un carácter normal, coloque delante una barra invertida. Por ejemplo, [t-v]x+ significa tx, txx, txx, etc., ux, uxx, etc., pero \[t-v\]x+ significa [t-v]x, [t-v]xx, [t-v]xxx, etc.
  2. Para agrupar elementos de expresiones regulares, utilice paréntesis. Por ejemplo, (a|b)+|c significa c o cualquier combinación del tipo abbbaaabbb, ababab, etc. (cualquier palabra de longitud distinta de cero en la que puede haber cualquier combinación de aes y bes en cualquier orden), mientras que a|b+|c significa a, c y b, bb, bbb, etc.

Ejemplos

Suponga que está reconociendo una tabla con tres columnas: fechas de nacimiento, nombres y direcciones de correo electrónico. En este caso, puede crear dos nuevos idiomas: Datos y Dirección, y definir las siguientes expresiones regulares para estos.

Expresión regular para fechas:

El número que denota un día puede constar de un dígito (1, 2, etc.) o de dos dígitos (02, 12), pero no puede ser cero (00 ó 0). Por lo tanto, la expresión regular correspondiente al día debe tener el siguiente aspecto: ((|0)[1-9])|([1|2][0-9])|(30)|(31).

La expresión regular correspondiente al mes debe tener el siguiente aspecto: ((|0)[1-9])|(10)|(11)|(12).

La expresión regular correspondiente al año debe tener el siguiente aspecto: ([19][0-9][0-9]|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9]).

Ahora lo único que necesitamos es combinar todo esto y separar los números mediante un punto (por ejemplo, 1.03.1999). El punto es un símbolo de expresión regular, por lo que debe colocar una barra invertida (\) que lo anteceda.

La expresión regular de la fecha íntegra debe tener el siguiente aspecto:

((|0)[1-9])|([1|2][0-9])|(30)|(31)\.((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])|([20][0-9][0-9]|([0-9][0-9])

Expresión regular para las direcciones de correo electrónico:

[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+

11/2/2018 4:19:20 PM

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.