将HTML另存为独立页面:导出工具?

时间:2014-07-04 06:50:25

标签: javascript jquery python html blob

我需要定期将html页面作为独立的.html文件发送到客户端,没有外部依赖项。原始页面是用node.js和express完成的,它们包含几个库,如High Charts。 到目前为止,我手动完成了准备工作,其中包括:

  • 将所有图像转换为blob
  • 复制页面内的所有外部.js和.cs
  • 尽可能减少(jQuery或Bootstrap等标准库)

结果是一个.html文件,可以在没有互联网连接的情况下打开,看起来就像原始文件一样。

有自动执行此操作的工具吗?如果没有,也许我会在Python中自己编写代码。你对此有什么建议吗?

由于

2 个答案:

答案 0 :(得分:0)

向OP道歉,因为这个答案对他来说可能已经太迟了,但是我发布它是为了帮助有类似问题的人:

HTTrack是一个开源项目,几乎完全按照你的描述进行,但它并不能完美地用于一些更奇特的JS。

它使用大多数的JS,主要图像以及页面需要显示的所有内容来保存页面。它可以配置为包含或排除整个或部分JS,图像和CSS。

enter image description here

这不会将所有JS和其他内容导入到HTML文件中,而是将所有内容整齐地组织到一个文件夹中,并纠正所有路径以使文件夹可移植。

它似乎也难以获取受保护的一些外部源,但如果它是您的本地站点并且只是使用像JQuery这样的常见脚本,那么您应该没问题。当我测试它时,它正确地下载了我所有的本地CSS和我合并的任何有效的外部CSS库,我使用的JQuery和派生脚本,以及嵌入的图像。

只是为了向每个人保存一个问题,默认情况下,该程序会将下载的网站保存到C:\My Web Sites

答案 1 :(得分:0)

Monolith是一个CLI工具,用于将整个网页另存为单个HTML文件

请参见https://github.com/Y2Z/monolith