我正在做一个简单的项目(比什么都重要的Web开发练习),而且很早就遇到了一个问题。就上下文而言,我正在尝试从几个类别中挑选出亚马逊最畅销的三十种产品。我使用的是Google工作表的公式=importXML()
,而不是常规的网络抓取工具。此公式接受网站和XPath位置。
以下是示例网页:https://www.amazon.com/Best-Sellers-Beauty/zgbs/beauty/ref=zg_bs_nav_0
我经过检查器后,发现它是一个较大的物品清单,经过进一步挖掘后,我以为我找到了产品的标题,然后右键单击>复制>复制XPath。
这是复制的XPath://*[@id="zg-ordered-list"]/li[1]/span/div/span/a/div
我将其输入到Google工作表中,并返回#N / A,这也就不足为奇了,因为当我进入Chome控制台并输入:$x('//*[@id="zg-ordered-list"]/li[1]/span/div/span/a/div')
时,我得到了一个很大的对象。
如果有人可以帮助我并指出正确的XPath位置,我将非常感激。
答案 0 :(得分:0)
您必须使用string
来获取文本。
'string(xpath)'
Chrome控制台:
$x('string(//*[@id="zg-ordered-list"]/li[1]/span/div/span/a/div)')
输出:
Philips Sonicare Diamond Clean Classic Rechargeable 5 brushing modes, Electric…