我在ask.fm上搜索一个研究问题的个人资料。问题是只有最新的问题是可见的,我必须点击“查看更多”才能看到下一个问题。
点击查看的源代码如下所示:
<input class="submit-button-more submit-button-more-active" name="commit" onclick="return Forms.More.allowSubmit(this)" type="submit" value="View more" />
在刮取之前,有4种方法可以轻松调用它。我想要网站上最新的60个帖子。 Python更可取。
答案 0 :(得分:0)
您可以使用selenium浏览网站并单击按钮/链接几次。你可以在这里得到:
或者你可以用机械化来做到这一点:
我也听过关于斜纹的好东西,但从未使用过它:
答案 1 :(得分:0)
不使用无头浏览器
使用无头浏览器
尝试使用加载动态内容的无头浏览器,您可以使用向下滚动的方法,单击可用的其他方法。
无头浏览器的示例是Selenium,Splash,PhantomJS,SlimmerJS等。