我正在尝试从beautifulsoup结果中计算'汤'中的标签数量。我想使用正则表达式,但遇到了麻烦。 我试过的代码如下:
reg_exp_tag = re.compile("<[^>*>")
tags = re.findall(reg_exp_tag, soup(cast as a string))
但re
不允许reg_exp_tag
,意外结束正则表达式错误。
非常感谢任何帮助!
由于
答案 0 :(得分:4)
如果您已经使用BeautifulSoup解析了HTML,为什么还要再次解析它?试试这个:
num_tags = len(soup.findAll())
答案 1 :(得分:1)
不应该是"<[^>]*>"
而不是"<[^>*>"
吗?
(需要使用]
)