XPath地址不够详细

时间:2019-03-12 23:02:56

标签: html xpath web-scraping google-sheets

我正在做一个简单的项目(比什么都重要的Web开发练习),而且很早就遇到了一个问题。就上下文而言,我正在尝试从几个类别中挑选出亚马逊最畅销的三十种产品。我使用的是Google工作表的公式=importXML(),而不是常规的网络抓取工具。此公式接受网站和XPath位置。

以下是示例网页:https://www.amazon.com/Best-Sellers-Beauty/zgbs/beauty/ref=zg_bs_nav_0

我经过检查器后,发现它是一个较大的物品清单,经过进一步挖掘后,我以为我找到了产品的标题,然后右键单击>复制>复制XPath。

这是复制的XPath://*[@id="zg-ordered-list"]/li[1]/span/div/span/a/div

我将其输入到Google工作表中,并返回#N / A,这也就不足为奇了,因为当我进入Chome控制台并输入:$x('//*[@id="zg-ordered-list"]/li[1]/span/div/span/a/div')时,我得到了一个很大的对象。

如果有人可以帮助我并指出正确的XPath位置,我将非常感激。

1 个答案:

答案 0 :(得分:0)

您必须使用string来获取文本。

'string(xpath)'

Chrome控制台:

$x('string(//*[@id="zg-ordered-list"]/li[1]/span/div/span/a/div)')

输出:

Philips Sonicare Diamond Clean Classic Rechargeable 5 brushing modes, Electric…