我想使用木偶操作员来搜索页面并返回所有可用资源,包括图像,pdf,任何可嵌入的内容等。
对于我们这里的目的,让我们简单地用图像滚动。 img
标记有src
属性但是通过CSS规则加载的图像呢?有没有办法看到加载的资产总数?
答案 0 :(得分:2)
一种方法是listen on the event requestfinished
const browser = await puppeteer.launch();
const page = await browser.newPage();
page.on('requestfinished', (request) => {
console.log(request.url())
});
await page.goto('http://www.wildesoft.net/');
await page.waitFor(5000);
await browser.close();
这会将所有收到的资源记录到控制台,例如