如何将包含其所有元素(css,js,images,...)的网页快照保存到一个文件中

时间:2011-04-11 20:17:30

标签: javascript html css http archive

如何以编程方式将包含其所有元素(css,js,images,...)的网页快照保存到一个文件中?

我需要定期存档一些网页。然而,仅仅保存他们的HTML代码是没用的 - 不仅因为图像缺失,而且因为esp。因为今天网页上缺少CSS可能会使网页变得无法辨认。

我记得像这样工作的.mht格式,但这需要手动保存,而这只是IE的一个功能。我相信有一个开源解决方案可以通过编程实现这一目标,但是尽管经过了数小时的搜索,我还是无法在网上找到它。

5 个答案:

答案 0 :(得分:11)

答案 1 :(得分:1)

我认为@reisio(+1)已经涵盖了......

...但是如果只是为了插入一个很棒的免费工具,我会指出Firefox扩展Save Complete,它在 ad hoc 基础。输出将是一个HTML文件,其中包含所有资源的附带目录 - 您可以轻松地将它们压缩以进行存档。

这不是没有错 - 我最近在OSX上遇到了损坏的.png文件的问题,但我经常使用它来构建实时页面的模型,这是一个节省大量时间的方法。 (另外值得注意的是,它尚未针对FF 4进行更新,这是我回归到3.6的唯一原因)

答案 2 :(得分:1)

在终端中使用wget

wget -p -k http://www.example.com/

它将克隆站点前端的html,css,js,svg等。但不能按要求存储在一个文件中。

文档:https://www.gnu.org/software/wget/manual/wget.html

答案 3 :(得分:0)

如果您使用的是Google Chrome浏览器,只需将保存页面用作菜单项(CTRL + s),然后从文件对话框底部的选项中选择完整网站。这样可以保存HTML和所有必需的资源(在单独的文件夹中)。

答案 4 :(得分:0)

Apple的Safari有一个很好的解决方案。它保存所有HTML和CSS(很少保存JS),但是保存为webarchive格式。这是一个文件,但是需要Safari才能保存和打开,而Safari则需要Mac。尽管Safari for Windows 确实存在,但它已经过时了,无法使用网页,甚至不支持另存为webarchive或打开它们。如果您使用的是Mac,请在Safari中打开任何网站,然后按⌘S,然后确保Web存档出现在下拉菜单中。

还有一个Chrome extension可以打开这些类型的文件,但不能保存它们。

为回复这样一个旧话题而道歉,只是想传播此信息!