假设我们有这个:
html = 'http://example.com'
regex = '<(\d{0,2})>'
regex1 = '<span>(.+?)</span>'
p = re.compile(regex)
p1 = re.compile(regex1)
是否可以在re.findall
声明中p
同时p1
和findall
?
答案 0 :(得分:1)
首先:您通常希望避免使用正则表达式来解析HTML。你真的想要使用HTML解析器。 BeautifulSoup允许您搜索包含特定文本的元素(甚至使用正则表达式来匹配HTML中的特定方面)
您可以在组中使用|
管道组合正则表达式:
p_or_p1 = re.compile('(?:{}|{})'.format(p, p1))