XPath用于span和div

时间:2018-08-22 12:08:55

标签: python xml parsing xpath lxml

<div id="buyNewSection" class="rbbHeader dp-accordion-row">
<h5>
<div class="a-row">
    <div class="a-column a-span4 a-text-left a-nowrap">
        <span class="a-text-bold">Buy New</span>
    </div>
    <div class="a-column a-span8 a-text-right a-span-last">
        <div class="inlineBlock-display">
            <span class="a-letter-space"></span>
            <span class="a-size-medium a-color-price offer-price a-text-normal">$13.00</span>
        </div>
    </div>
</div>
</h5>

请帮助我们如何使用XPATH提取价格$ 13?

如果div ID不存在,那么XPATH是什么?

我正在尝试使用python进行抓取。感谢任何帮助。

2 个答案:

答案 0 :(得分:2)

使用lxml进行解析:

from lxml import html

doc = html.fromstring(raw_html)
doc.xpath('//span[contains(@class,"offer-price")]')[0].text

这将返回:'$ 13.00'

xpath部分仅查找所有跨度://span并为特定的类标记[contains(@class,"offer-price")]过滤那些跨度

答案 1 :(得分:1)

//span[@class = 'a-size-medium a-color-price offer-price a-text-normal']