我正在使用lxml库从HTML页面获取属性值。
例如:
<span class="you-save">Rs. 5000</span>
我使用下面的
获得了正确的结果(5000)print doc.xpath('//span[@class="you-save"]//text()')
我想获取属性值,例如
<meta itemprop="price" content="4999.00">
我想提取“4999.00”。我无法弄清楚这一点。
我在下面试过但没有得到任何结果。
print doc.xpath('//meta[@itemprop="price"]/content::text()')
答案 0 :(得分:2)
您可以使用@
使用属性轴来获取属性值。
例如:
from lxml.etree import fromstring
xml = """<some>
<nodes>
<meta itemprop="price" content="4999.00"></meta>
</nodes>
</some>"""
doc = fromstring(xml)
print(doc.xpath('//meta[@itemprop="price"]/@content'))