如何在Python中使用正则表达式查找整个单词? 我使用Beautiful soup和re library来解析文档。在汤中,我需要在“电子邮件”字样后找到所有内容。我试试
for sublink in link.findAll(text = re.compile("[E-mail:0-9a-zA-Z]")):
print sublink.encode('utf-8')
但它不起作用。
答案 0 :(得分:1)
以下是通过正则表达式提取单词的工作示例:
import re
text = "First line\n" + \
"Second line\n" + \
"Important line! E-mail:mail@domain.de, Phone:991\n" + \
"Another important line! E-mail:tom@gmail.com, Phone:001\n" + \
"Another line"
print text
emails = re.findall("E-mail:([\w@.-]+)", text)
print "Found email(s): " + ', '.join(emails)
输出:
Found email(s): mail@domain.de, tom@gmail.com
不确定这是否是您要找的。 p>
修改:字符0-9a-zA-Z
可以写为\w
。是的,我添加了.
和-
。如果有更多可能的字符,只需将它们放入[\w@.-]
。