我正在尝试使用无限滚动来解析页面的HTML。我想加载所有内容,以便我可以解析所有内容。我正在使用Python。任何提示?
答案 0 :(得分:1)
这些页面用AJAX更新他们的html。通常你只需要找到浏览器发送的新AJAX请求,猜测AJAX url参数的含义并从API中获取数据。
API服务器可以验证AJAX请求的用户代理,引用,cookie,oauth_token ......,并密切关注它们。
答案 1 :(得分:1)
数据是
提前加载
或页面在您滚动
您可以使用httpfox查找请求并发送