我是Python新手。我有一个包含许多电子邮件ID和普通单词的字符串。我想获得包含特定单词的电子邮件ID的数量。目前我正在使用正则表达式过滤掉包含该字符串的单词和此列表中的另一个正则表达式来过滤掉电子邮件ID。只是想知道是否有更好的方法来做到这一点!
示例:
Str1:这个fet@dmail.com是一个字符串,与get@dmail.com和net@dfet.com有关。
Str2:fet
程序应将计数返回为2 fet@dmail.com 2. net@dfet.com
这是我目前使用的代码..我正在创建一个包含str2的字符串列表,并验证它是否是电子邮件ID ...
text_to_search = ".*(" + word_to_be_searched.lower() + ").*"
regex = re.compile(text_to_search)
lister = [m.group(0) for l in row_value[column_index].lower().split( ) for m in [regex.search(l)] if m]
for li in lister:
if re.match("^[a-zA-Z0-9._%-]+@[a-zA-Z0-9._%-]+.[a-zA-Z]{2,6}$", li):
match_count = match_count + 1
答案 0 :(得分:0)
请运行以下代码。它将解决您的问题
import re
regex = re.compile(("([a-z0-9!#$%&'*+\/=?^_`{|}~-]+(?:\.[a-z0-9!#$%&'*+\/=?^_`"
"{|}~-]+)*(@|\sat\s)(?:[a-z0-9](?:[a-z0-9-]*[a-z0-9])?(\.|"
"\sdot\s))+[a-z0-9](?:[a-z0-9-]*[a-z0-9])?)"))
email_iter = (email[0] for email in re.findall(regex, str1) if not email[0].startswith('//'))
email_collec = []
for email in email_iter:
email_collec.append(email)
count = 0
str2 = "fet"
for i in range(len(coll)):
if str2 in coll[i]:
count+=1
print count