Question

我使用set以这种方式获取某些网页内容：

scrapy

一切正常。

现在，我不想直接点击页面，而是想抓取同一页面的class PitchforkTracks(scrapy.Spider): name = "pitchfork_tracks" allowed_domains = ["pitchfork.com"] start_urls = [ "http://pitchfork.com/reviews/best/tracks/?page=1", "http://pitchfork.com/reviews/best/tracks/?page=2", "http://pitchfork.com/reviews/best/tracks/?page=3", ] google。

实现该目标的caches是什么？

PS：我试过syntax，但无济于事。

Answer 1

您可以使用以下Google网址抓取缓存页

http://webcache.googleusercontent.com/search?q=cache:http://pitchfork.com/reviews/best/tracks/?page=1

刮取缓存页面

1 个答案: