标签: python scrapy
这是我使用
Rule(LinkExtractor(allow='(http\:\/\/www\.example\.com\/.*_reviews.*-page-\d+\.html)'), follow=True, callback="parse_data")
虽然这会从start_urls中提取匹配的链接,但它会在页面中将匹配的链接提取为yield request在蜘蛛代码中的某个位置。
start_urls
yield request
这是scrapy功能的正常方式吗?