如何完整地提取网页,并将其依赖项内联,并将图像转换为dataURI?

时间:2016-05-16 19:46:31

标签: javascript web-scraping

我有一个我想下载的页面。

它有50多张图片,我可以去下载它们。
但是,是否有一个工具可以使用url,并为所有图像提供一个html个文件,并js内联?

2 个答案:

答案 0 :(得分:1)

您可以使用wget下载包含所有资源的网页(这不是单个文件,但不依赖于外部资源)

或此浏览器扩展程序https://chrome.google.com/webstore/detail/save-as-mhtml/eomfifclcdpkaghkehajpolkdnkmegfa?hl=en

但这不是网页抓取或javascript主题,所以我要投票给你

答案 1 :(得分:1)

这个怎么样? https://www.httrack.com/ 我用了好几次,效果很好。