LinkExtractor和SgmlLinkExtractor之间的区别

时间:2016-05-17 18:18:18

标签: python web-scraping scrapy

我是scrapy框架的新手,我看过一些使用LinkExtractors的教程和一些使用SgmlLinkExtractor的教程。我试图寻找两者的差异/利弊,但结果并不令人满意。

有人可以告诉我两者之间的区别吗?我们什么时候应该使用上述提取器?

谢谢!

1 个答案:

答案 0 :(得分:11)

您无法找到SgmlLinkExtractor内容的引用的问题在于它现在已被弃用(相关changeset)。您可以在Scrapy 0.24文档中找到SgmlLinkExtractor定义here

并且,您不应再使用SgmlLinkExtractor - Scrapy现在只留下一个链接提取器 - LxmlLinkExtractor - LinkExtractor别名所指向的那个。