我正在使用Python解析HTML代码,并且想要一个返回名称列表的函数。
我正在寻找的HTML格式如下:
<input type=hidden name=user value="msmith">
每次&#34; type = hidden&#34;和&#34; name = user&#34;,我想&#34; msmith&#34;要包含在导出名称列表中。
代码必须是可移植的,并且不能包含第三方库,例如beautifulSoup。最好是使用HTMLParser
。
答案 0 :(得分:0)
我个人更喜欢BeautifulSoup。你可以这样做:
from bs4 import BeautifulSoup
soup = BeautifulSoup(txt)
hidden_tags = soup.find_all("input", type="hidden")
for tag in hidden_tags:
# tag.name is the name and tag.value the value, simple isn't it ?