我想在xml树中加载页面的html内容,并在python中使用lxml删除其中的元素。我只是想知道如何从内容中删除元素?
答案 0 :(得分:1)
您可以使用BeautifulSoup4
和lxml
的组合轻松实现目标。
将HTML解析为树/汤。你只需安装所有配料即可。
from bs4 import BeautifulSoup
html = """..."""
soup = BeautifulSoup(html, 'lxml')
...
您修改了树,这里是一个完整的参考列表,教您如何修改标签的内容/属性等。
以下an example我修改了anchor
代码