使用lxml提取属性值

时间:2016-11-30 14:31:25

标签: python html xpath lxml

我正在使用lxml库从HTML页面获取属性值。

例如:

<span class="you-save">Rs. 5000</span>

我使用下面的

获得了正确的结果(5000)
print doc.xpath('//span[@class="you-save"]//text()') 

我想获取属性值,例如

<meta itemprop="price" content="4999.00">

我想提取“4999.00”。我无法弄清楚这一点。

我在下面试过但没有得到任何结果。

 print doc.xpath('//meta[@itemprop="price"]/content::text()')

1 个答案:

答案 0 :(得分:2)

您可以使用@使用属性轴来获取属性值。

例如:

from lxml.etree import fromstring

xml = """<some>
<nodes>
<meta itemprop="price" content="4999.00"></meta>
</nodes>
</some>"""

doc = fromstring(xml)
print(doc.xpath('//meta[@itemprop="price"]/@content'))