应用错误收集

获取网页的完整内容（使用Python请求）

时间：2018-07-17 11:30:54

标签： python web-scraping python-requests

我是这个学科的新手，所以我的问题可能很愚蠢..预先对不起。我的挑战是进行网页抓取，例如针对此页面：link (google)

我尝试使用Python在网络上抓取它，我的问题是，一旦我使用Python request.get，似乎就无法获得页面的全部内容。我猜这是因为该页面有很多资源，而Python并没有全部获取它们。（此外，一旦我向上滚动鼠标，Chrome上就会收到更多数据。从源代码中可以看到，没有更多数据下载显示。）如何获得网页的全部内容？我想念什么？

谢谢

1 个答案:

答案 0 :(得分：-1)

requests.get将使您获得页面网页，但只有页面决定赋予机器人的内容。如果您希望整页的网站像人类一样看待，则需要通过更改标题来欺骗它。如果您需要滚动或单击按钮才能查看整个网页，这是我认为您需要做的，我建议您看看selenium。