web-scraping - Puppeteer：如何使用chrome headless browser api下载文件？

时间：2017-08-16 18:36:02

标签： web-scraping google-chrome-headless puppeteer

使用Puppeteer，我如何让无头镀铬浏览器下载文件（或发出额外的http请求并保存响应）？

答案 0 :(得分：0)

您可以通过窗口发出一个简单的请求，它应该可以工作。 npm request

只要它在您的回复中返回承诺，您就可以编写快速保存功能，并存储响应。

似乎木偶操作者有这个实现。看这里： How to make a request with puppeteer

看看这个：

页面发出请求时发出。请求对象是只读的。要拦截和变更请求，请参阅page.setRequestInterceptionEnabled。

我希望这会有所帮助。

答案 1 :(得分：0)

这是我编写的一个工具，用于下载页面加载时使用的所有资源。

<块引用>

此节点命令行实用程序使用无头浏览器 (Puppeteer) 来呈现网页并下载它可能需要的所有资源。这些资源包括原始HTML都保存在本地...