Scrapy SgmlLinkExtractor和span属性

时间:2012-07-21 07:01:46

标签: python scrapy

我需要将属性与某些字符串匹配。 我试图将span属性添加到sgmllinkextractor但它似乎忽略它,因为它没有链接。

是否有选项可以使用回调函数,当没有链接可以通过linkExtractor提取时将调用该函数?

当且仅当与linkExtractor不匹配时,我想将页面与某些字符串匹配。

由于

1 个答案:

答案 0 :(得分:0)

尝试继承BaseSpider而不是使用CrawlSpider。