应用错误收集

使用Scrapy抓取ajax页面

时间：2013-06-19 09:12:50

标签： python selenium scrapy

我正在使用Scrapy一个月。我能够根据管道中给出的关键字抓取并抓取几个网站（事实上我已经抓取了900个网站）。现在，问题是当我们遇到javapages（ajax）时，scrapy不会刮掉。我正在尝试使用以下代码selenium code for scraping ajax pages using scrapy 并进行适当的更改以刮取ajax页面

你们有没有任何好主意使用scrapy抓取javapages

第二个问题，我面对的是scrapy并没有刮到登录页面

1 个答案:

答案 0 :(得分：0)

首先监控已使用ajax发送的请求（使用fiddler用于此目的或使用firefox firebug），然后在scrapy中生成类似的请求，它将带来响应。

我无法理解你的意思是“scrapy doesnt scrape login page”：这是否意味着您无法删除需要您登录的页面或登录页面本身

Scrapy没有抓取所有页面
使用Scrapy抓取ajax页面
Scrapy没有抓取页面
抓取有限的页数
使用Scrapy进行抓取页面身份验证
Scrapy不会抓取LinkExtractor允许的页面
报废/抓取多个页面
Scrapy抓取0页
搜寻具有类别的网页
cra草不爬行任何页面

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？