Puppeteer:如何使用chrome headless browser api下载文件?

时间:2017-08-16 18:36:02

标签: web-scraping google-chrome-headless puppeteer

使用Puppeteer,我如何让无头镀铬浏览器下载文件(或发出额外的http请求并保存响应)?

2 个答案:

答案 0 :(得分:0)

您可以通过窗口发出一个简单的请求,它应该可以工作。 npm request

只要它在您的回复中返回承诺,您就可以编写快速保存功能,并存储响应。

似乎木偶操作者有这个实现。看这里: How to make a request with puppeteer

看看这个:

页面发出请求时发出。请求对象是只读的。要拦截和变更请求,请参阅page.setRequestInterceptionEnabled。

我希望这会有所帮助。

Link for setting headers

答案 1 :(得分:0)

这是我编写的一个工具,用于下载页面加载时使用的所有资源。

<块引用>

此节点命令行实用程序使用无头浏览器 (Puppeteer) 来呈现网页并下载它可能需要的所有资源。这些资源包括原始HTML都保存在本地...

https://github.com/stav/wgrep