Регулярни изрази
Regular Expressions (понякога съкратено като regexp, regex или re) са инструмент за съвпадение на модели в текст. В Python, имаме модула re. Приложенията за регулярни изрази са широко разпространени, но те са доста сложни, затова, когато обмисляте използването на регулярен израз за определена задача, помислете за алтернативи и се обърнете към тях само като последна мярка.
Пример за регулярен израз е r"^(From|To|Cc).*[email protected]"
. Сега за обяснението:
каретката ^
съвпада с текст в началото на реда. Следващата група, частта с (From|To|Cc)
означава, че редът трябва да започва с една от думите, които са разделени с тръбата |
. Това се нарича OR оператор, и регулярният израз ще съвпадне, ако редът започва с която и да е дума от групата. .*?
означава неагресивно съвпадение на всякакъв брой символи, с изключение на символа за нов ред \n
. Неагресивната част означава да се съвпадат възможно най-малко повторения. Символът .
означава всеки символ, който не е нов ред, *
означава да се повтаря 0 или повече пъти, а символът ?
прави го неагресивен.
И така, следните редове ще бъдат съвпаднати от този регулярен израз:
From: [email protected]
To: !asp]<,. [email protected]
Пълна справка за синтаксиса на re е налична в python docs.
Като пример за "правилен" регулярен израз за съвпадение на имейл (като този в упражнението), вижте тук
# Example:
import re
pattern = re.compile(r"\[(on|off)\]") # Slight optimization
print(, "Mono: Playback 65 [75%] [-16.50dB] [on]"))
# Returns a Match object!
print(, "Nada...:-("))
# Doesn't return anything.
# End Example
# Exercise: make a regular expression that will match an email
import re
def test_email(your_pattern):
pattern = re.compile(your_pattern)
emails = ["[email protected]", "[email protected]", "wha.t.`1an?ug{}[email protected]"]
for email in emails:
if not re.match(pattern, email):
print("You failed to match %s" % (email))
elif not your_pattern:
print("Forgot to enter a pattern!")
# Your pattern here!
pattern = r"\"?([-a-zA-Z0-9.`?{}]+@\w+\.\w+)\"?"
success_msg("Great work!")
