ביטויים רגילים

הטבלה שלהלן מפרטת את הביטויים הרגילים שבהם ניתן להשתמש ליצירת מילון עבור שפה בהתאמה אישית.

שם פריט סמל ביטוי רגיל מקובל דוגמאות לשימוש והסברים
כל תו . c.t— מציין "cat‏," "cot" וכו'
תו מקבוצה [] ‎[b-d]ell— מציין "bell‏," "cell‏," "dell" וכו', ‎[ty]ell— מציין "tell" ו-"yell"
תו שאינו מקבוצה [^] ‎[^y]ell— מציין "dell‏," "cell‏," "tell" אך אוסר על "yell”,‏ ‎[^n-s]ell— מציין "bell‏," "cell" אך אוסר על "nell‏," "oell‏," "pell‏," "qell‏," "rell" ו-"sell"
או | c(a|u)t— מציין "cat" ו-"cut"
0 או יותר התאמות * *10— מציין את המספרים 1, 10, 100, 1000 וכו'
1 או יותר התאמות + +10— מתיר את המספרים 10, 100, 1000 וכו'
אות או ספרה [0-9a-zA-Zа-яА-Я] [0-9a-zA-Zа-яА-Я]— מאפשר כל תו יחיד, +[0-9a-zA-Zа-яА-Я]— מאפשר כל מילה
אות לטינית רישית [A-Z]
אות לטינית קטנה [a-z]
אות קירילית רישית [А-Я]
אות קירילית קטנה [а-я]
ספרה [0-9]
@ שמור.

הערה:

  1. כדי להשתמש בסמל ביטוי רגיל כתו נורמלי, הצב לפניו קו נטוי הפוך. לדוגמה, ‎[t-v]x+ מייצג את tx‏, txx וכו', ux‏, uxx וכו' ואת vx‏, vxx וכו', אבל ‎\[t-v\]x+ מייצג את ‎[t-v]x‏, ‎[t-v]xx‏, ‎[t-v]xxx וכו'
  2. כדי לקבץ אלמנטים של ביטוי רגיל, השתמש בסוגריים מרובעים. לדוגמה, ‎(a|b)+|c מייצג את c או כל שילוב כמו abbbaaabbb‏, ababab וכו' (מילה הארוכה מ-0 שבה האותיות a ו-b יכולות לחזור על עצמן ללא הגבלה ובכל סדר), בזמן ש-a|b+|c מייצג את a‏, c‏, b‏, bb‏, bbb וכו'

דוגמאות

נניח שאתה רוצה לזהות טבלה בעלת שלוש עמודות: תאריכי לידה, שמות וכתובות דואר אלקטרוני. במקרה כזה, ניתן ליצור שתי שפות חדשות, 'תאריך' ו'כתובת', ולציין עבורן את הביטויים הרגילים הבאים.

ביטוי רגיל עבור תאריכים:

המספר שמציין יום יכול לכלול ספרה אחת (1, 2 וכו') או שתי ספרות (02, 12), אך הוא לא יכול להיות אפס (00 או 0). לכן הביטוי הרגיל עבור היום צריך להיראות כך: (‎(|0)[1-9])|([1|2][0-9])|(30)|(31).

הביטוי הרגיל עבור החודש צריך להיראות כך: (‎(|0)[1-9])|(10)|(11)|(12).

הביטוי הרגיל עבור השנה צריך להיראות כך: (‎[19][0-9][0-9])|([0-9][0-9]‎).

כעת כל שנותר לעשות הוא לשלב את הכול יחד ולהפריד את המספרים באמצעות נקודה. הנקודה היא סמל ביטוי רגיל, ולכן עליך להציב לפניה קו נטוי הפוך (\).

הביטוי הרגיל עבור התאריך במלואו צריך להיראות כך:

(‎(|0)[1-9])|([1|2][0-9])|(30)|(31)\. ((|0)[1-9])|(10)|(11)|(12)\.((19)[0-9][0-9])|([0-9][0-9])

ביטוי רגיל עבור כתובות דואר אלקטרוני:

‎[a-zA-Z0-9_\-\.]+\@[a-z0-9\.\-]+‎

02.11.2018 16:19:24

Please leave your feedback about this article

Usage of Cookies. In order to optimize the website functionality and improve your online experience ABBYY uses cookies. You agree to the usage of cookies when you continue using this site. Further details can be found in our Privacy Notice.