Scrapy:如何将start_urls中的url发送给我的回调?

时间:2014-02-15 02:02:30

标签: python scrapy

我有以下代码

start_urls = ['http://mydomain.com/results.php?123123123123']
rules = (Rule(SgmlLinkExtractor(allow=[r'results.php'], restrict_xpaths=('//a[text()="Next"]')), callback='parse_item', follow=True, ),)

它会解析除第一页以外的所有内容。我怎样才能解决这个问题?我在start_urls中指定的URL也有我需要解析的结果。我还需要发送start_urls中指定的URL进入我的parse_item回调。

1 个答案:

答案 0 :(得分:1)

我正在回答我自己的问题,其他任何人都有同样的问题。只需将我的回调从parse_item重命名为parse_start_url即可。现在,起始URL和规则提取的URL将发送到我的回调。