我试图用刮y的蟒蛇刮擦这个网站。我抓取了大部分信息,但由于某种原因xpath不会抓取除法

时间:2018-09-17 06:00:10

标签: python xpath web-scraping scrapy

Page i am trying to scrape

这是我的代码

 Download_links = response.xpath('//div[@class = "download-block"]').extract()

这将返回一个Empy列表。为什么我不能只抓这个div?

这是我要抓取的页面部分 photo for the part i am trying to scrape

请提供一些帮助

1 个答案:

答案 0 :(得分:0)

您将得到一个空列表,因为该划分不在页面源中。编写xpath之前,请始终检查页面源中是否存在数据。 数据可能在页面的其他部分,请搜索​​页面源(ctrl + u)并获取正确的xpath。 在此页面的此处,下载链接位于页面源中。 see the image of the page source