python lxml打印空列表

时间:2014-07-31 02:34:47

标签: python html html-parsing lxml

这段代码每次打印[]。我通过firepath检查并手动检查,xpath表达式是正确的。

source = requests.get('http://example.com').text
x = source.encode('ascii', 'ignore') #for html entities
print [p for p in fromstring(x).xpath('/html/body/div[3]/table/tbody/tr[4]/td/div/div[1]/form/input[9]')]

1 个答案:

答案 0 :(得分:0)

通过input属性获取name并获取value属性的值:

import lxml.html

tree = lxml.html.fromstring(source)
print tree.xpath('//input[@name="auth"]/@value')[0]

打印:AzfnTz624V0WmSiezU5U2TmtPo-...