Question

如何在Python中使用正则表达式查找整个单词？我使用Beautiful soup和re library来解析文档。在汤中，我需要在“电子邮件”字样后找到所有内容。我试试

for sublink in link.findAll(text = re.compile("[E-mail:0-9a-zA-Z]")):
         print sublink.encode('utf-8')

但它不起作用。

Answer 1

以下是通过正则表达式提取单词的工作示例：

import re

text = "First line\n" + \
    "Second line\n" + \
    "Important line! E-mail:mail@domain.de, Phone:991\n" + \
    "Another important line! E-mail:tom@gmail.com, Phone:001\n" + \
    "Another line"
print text

emails = re.findall("E-mail:([\w@.-]+)", text)
print "Found email(s): " + ', '.join(emails)

输出：

Found email(s): mail@domain.de, tom@gmail.com

不确定这是否是您要找的。

修改：字符0-9a-zA-Z可以写为\w。是的，我添加了.和-。如果有更多可能的字符，只需将它们放入[\w@.-]。

python正则表达式中的整个单词

1 个答案: