应用错误收集

scrapy docs author spider无法抓取内部链接

时间：2019-04-17 19:47:16

标签： hyperlink scrapy web-crawler internals

我在刮y的文档中尝试了AuthorSpider，但它没有为我返回作者页面，甚至没有使用parse_author()方法，我想抓取一个包含多个内部内容的网站链接，然后单击该链接以爬网文章，我尝试了所有简单的代码，将response.follow()与几种解析方法一起使用，但是它仅调用了第一个parse()方法，而parse_author()方法从未被叫。

0 个答案:

没有答案

scrapy没有爬行所有链接
Scrapy抓取简历不会爬行任何东西，只是完成
Scrapy爬行蜘蛛返回破碎的网址
Scrapy过早地爬行
使用scrapy抓取页面
使用scrapy以FIFO顺序爬行请求
Scrapy不会爬过网站
如何抓取网站上给出的每个链接并使用scrapy收集所有文本
如何通过JavaScript抓取内部链接？
scrapy docs author spider无法抓取内部链接

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？