我有一个在beautifulsoup语句之后生成的xml。它生成一个包含html
和body
标签的XML。我想从输出中同时删除html
和body
标签。我能知道我怎么能达到同样的效果吗?
代码:
soup = bs(''.join(output), "lxml")
print("soup output : {}".format(soup.html))
输出:
<html>
<body>
...
</body>
</html>
答案 0 :(得分:2)
尝试一下:
body = soup.find("body")
innerbody = body.decode_contents()