使用lxml和Python解析输入标记的一部分

时间:2017-10-02 16:18:11

标签: python html web-scraping lxml

我的输入标签看起来像这样:

<input name="sheet" value="5B" tabindex="994" data-enpassid="__11" type="submit">

不,我只想获得value-attribute(在这种情况下为5B)的内容。这可能是使用lxml,如果是这样,怎么样?

1 个答案:

答案 0 :(得分:0)

试试这个。我使用css选择器和xpath创建了两个表达式。他们都会给你5B作为结果:

html='''
<input name="sheet" value="5B" tabindex="994" data-enpassid="__11" type="submit">
'''
from lxml.html import fromstring

root = fromstring(html)
item = root.cssselect("input")[0].attrib['value']
item1 = root.xpath("//input/@value")[0]
print(item, item1)

结果:

5B, 5B