Scrapy - LinkExtractor不会从" yield"中提取链接。 (ed)请求?

时间:2015-09-07 06:53:47

标签: python scrapy

这是我使用

的规则示例
Rule(LinkExtractor(allow='(http\:\/\/www\.example\.com\/.*_reviews.*-page-\d+\.html)'), follow=True, callback="parse_data")

虽然这会从start_urls中提取匹配的链接,但它会在页面中将匹配的链接提取为yield request在蜘蛛代码中的某个位置。

这是scrapy功能的正常方式吗?

0 个答案:

没有答案