我有以下代码
start_urls = ['http://mydomain.com/results.php?123123123123']
rules = (Rule(SgmlLinkExtractor(allow=[r'results.php'], restrict_xpaths=('//a[text()="Next"]')), callback='parse_item', follow=True, ),)
它会解析除第一页以外的所有内容。我怎样才能解决这个问题?我在start_urls中指定的URL也有我需要解析的结果。我还需要发送start_urls中指定的URL进入我的parse_item回调。
答案 0 :(得分:1)
我正在回答我自己的问题,其他任何人都有同样的问题。只需将我的回调从parse_item
重命名为parse_start_url
即可。现在,起始URL和规则提取的URL将发送到我的回调。