应用错误收集

C＃抓取工具无法加载动态内容

时间：2019-07-09 14:49:51

标签： c# request web-crawler abot

我正在使用Abot库对网页进行爬网。搜寻器可以正确请求页面，但是问题在于几乎所有内容都是通过kickout.js动态加载的。搜寻器目前无法请求此内容，导致仅加载一小部分页面。

我已经尝试让程序等待，以期无论如何都希望发送动态请求，但这似乎行不通。

我希望加载整个页面，但只加载页面的底部。

如何使搜寻器请求所有数据？

谢谢！

1 个答案:

答案 0 :(得分：0)

简短答案：

用这种方法不可能，您需要像浏览器一样可以处理JS的东西。我会推荐Scrapy提供的Splash（它可以通过REST API与任何语言集成）。

但是，以我的拙见，如果您不需要企业解决方案，请不要使用C＃进行网络爬网，例如，有最简单的解决方案和更完整的python库。