我正在尝试解析一些HTML。我想像sgmllib
之类的东西,但它在python 3.2中已被弃用。
我可以使用备用模块吗?
感谢。
答案 0 :(得分:8)
内置HTMLParser模块: http://docs.python.org/py3k/library/html.parser.html
不是本地人,但值得一提; BeautifulSoup: http://www.crummy.com/software/BeautifulSoup/
答案 1 :(得分:3)
不确定你的本地人是什么意思,但我是lxml的粉丝。