解析HTML无限滚动

时间:2013-10-22 08:01:17

标签: python infinite-scroll

我正在尝试使用无限滚动来解析页面的HTML。我想加载所有内容,以便我可以解析所有内容。我正在使用Python。任何提示?

2 个答案:

答案 0 :(得分:1)

这些页面用AJAX更新他们的html。通常你只需要找到浏览器发送的新AJAX请求,猜测AJAX url参数的含义并从API中获取数据。

API服务器可以验证AJAX请求的用户代理,引用,cookie,oauth_token ......,并密切关注它们。

答案 1 :(得分:1)

数据是

  1. 提前加载

  2. 或页面在您滚动

  3. 时发送请求

    您可以使用httpfox查找请求并发送