使用Python的HTMLParser进行HTML解析

时间:2017-01-25 22:03:23

标签: python html parsing html-parsing

我正在使用Python解析HTML代码,并且想要一个返回名称列表的函数。

我正在寻找的HTML格式如下:

<input type=hidden name=user value="msmith">

每次&#34; type = hidden&#34;和&#34; name = user&#34;,我想&#34; msmith&#34;要包含在导出名称列表中。

代码必须是可移植的,并且不能包含第三方库,例如beautifulSoup。最好是使用HTMLParser

1 个答案:

答案 0 :(得分:0)

我个人更喜欢BeautifulSoup。你可以这样做:

from bs4 import BeautifulSoup
soup = BeautifulSoup(txt)
hidden_tags = soup.find_all("input", type="hidden")
for tag in hidden_tags:
    # tag.name is the name and tag.value the value, simple isn't it ?