如何将整个页面保存为一个文件以使其脱机工作(包括外部javascript)?

时间:2012-06-18 10:00:32

标签: javascript html

我需要能够将我网站上的页面保存到我的硬盘中,以便我可以在线和离线使用它。问题是,该页面使用对其自身文件夹之外的javascript和CSS文件的引用。非常重要的是我可以将整个页面保存为一个.html文件,这样外部文件中的所有javascript和CSS代码也都在该文件中。

有办法做到这一点吗?

这应该以编程方式

1 个答案:

答案 0 :(得分:0)

根据您的要求,这可以通过编程方式完成,比方说Python。 代码的模式如下所示:

  • 请求用户将网址粘贴到方框中
  • wget或curl页面并使用正则表达式找出所包含代码的位置
    • OR:使用像SGML这样的库直接与HTML标签交互
  • 将所有链接的CSS,JS等文件放入List
  • 获取所有链接文件的内容并将其放入List
  • 重建HTML源代码并删除和标记内容
  • 现在将链接文件的内容循环到标签中,如下所示:

    newHeaderContent =''

    表示linkedFilesArray中的内容:     newHeaderContent = newHeaderContent + content

    newHTML = firstHTMLCode + newHeaderContent + lastHTMLCode