应用错误收集

Scrapy - LinkExtractor不会从＆＃34; yield＆＃34;中提取链接。（ed）请求？

时间：2015-09-07 06:53:47

标签： python scrapy

这是我使用

的规则示例

Rule(LinkExtractor(allow='(http\:\/\/www\.example\.com\/.*_reviews.*-page-\d+\.html)'), follow=True, callback="parse_data")

虽然这会从start_urls中提取匹配的链接，但它会在页面中将匹配的链接提取为yield request在蜘蛛代码中的某个位置。

这是scrapy功能的正常方式吗？

0 个答案:

没有答案