使用lxml python etree从html页面中删除特定元素

时间:2013-11-24 06:45:13

标签: python lxml elementtree

我想在xml树中加载页面的html内容,并在python中使用lxml删除其中的元素。我只是想知道如何从内容中删除元素?

1 个答案:

答案 0 :(得分:1)

您可以使用BeautifulSoup4lxml的组合轻松实现目标。

将HTML解析为树/汤。你只需安装所有配料即可。

from bs4 import BeautifulSoup
html = """..."""
soup = BeautifulSoup(html, 'lxml')
...

您修改了树,这里是一个完整的参考列表,教您如何修改标签的内容/属性等。

BeautifulSoup/Modify The tree

以下an example我修改了anchor代码

的内容