Pythons可以HTMLParser编辑/更改HTML元素innerText或只读它

时间:2011-10-04 23:56:15

标签: python html html-parsing

我使用的是python模块HTMLParser.py

我能够正确解析HTML,但有没有更改HTML元素数据的选项(innerText)?

您知道如何使用HTMLParser模块执行此操作吗?

1 个答案:

答案 0 :(得分:0)

不,HTMLParser就是这样做的:它会解析您的HTML。

你可能正在寻找Beautiful Soup。它将创建一个ParseTree - 一个表示文档HTML元素的Pythonic对象树。然后,您可以搜索所需的对象(元素),为其指定一个新值,然后瞧!

documentation

无耻地偷走了
from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup("<b>Argh!</b>")
soup.find(text="Argh!").replaceWith("Hooray!")
print soup
# <b>Hooray!</b>