如何在亚马逊上获取PageRank的Xpath?

时间:2019-04-02 14:13:36

标签: python web-scraping scrapy

当我在Amazon上搜索商品时(在此示例中为“ Jeans”),我会获得产品概述。我想抓取/获得产品等级的顺序。

为了更加清楚,我附上了一张图片。我想找回数字(1、2、3、4等)。

这可行吗?我本来希望有一个Xpath,但是在HTML中找不到任何相关的内容。

enter image description here

对不起,这是我的第一个问题。希望一切都有意义。我将Python与Scrapy结合使用来完成此任务。

编辑。

我认为也可以算出一些'div'。任何人都可以体验到这一点[见图2]。 enter image description here

1 个答案:

答案 0 :(得分:0)

对于亚马逊,我使用此xpath

xpath_results= "//h5/a"

它代表产品的“主要”文本,如果您知道如何使用xpath(xml树和beautifulsoup),则会得到一个列表。然后进行迭代,您将知道顺序。 您的问题是关于xpath的,所以您明白了