匹配标签在BeautifulSoup

时间:2009-11-08 20:12:59

标签: python regex beautifulsoup

我正在尝试从beautifulsoup结果中计算'汤'中的标签数量。我想使用正则表达式,但遇到了麻烦。 我试过的代码如下:

reg_exp_tag = re.compile("<[^>*>")
tags = re.findall(reg_exp_tag, soup(cast as a string))

re不允许reg_exp_tag,意外结束正则表达式错误。

非常感谢任何帮助!

由于

2 个答案:

答案 0 :(得分:4)

如果您已经使用BeautifulSoup解析了HTML,为什么还要再次解析它?试试这个:

num_tags = len(soup.findAll())

答案 1 :(得分:1)

不应该是"<[^>]*>"而不是"<[^>*>"吗?

(需要使用]

关闭课程