我使用set
以这种方式获取某些网页内容:
scrapy
一切正常。
现在,我不想直接点击页面,而是想抓取同一页面的class PitchforkTracks(scrapy.Spider):
name = "pitchfork_tracks"
allowed_domains = ["pitchfork.com"]
start_urls = [
"http://pitchfork.com/reviews/best/tracks/?page=1",
"http://pitchfork.com/reviews/best/tracks/?page=2",
"http://pitchfork.com/reviews/best/tracks/?page=3",
]
google
。
实现该目标的caches
是什么?
PS:我试过syntax
,但无济于事。
答案 0 :(得分:2)