收集html文件中使用的所有js css和img资源

时间:2016-08-02 02:54:39

标签: javascript html node.js

我想编写一个npm包来本地化一个html url 1.使用html url下载html页面
2.解析html文件,提取html中使用的所有js,css和img文件以及本地资源。
3.如果这些js,css和img文件使用一些外部资源,则本地化这些资源。例如,在css中提取背景图像。

第一和第二要求很容易满足。但我不知道最后一个。 我可以解析所有的css文件并本地化其中使用的资源。但是我如何解析js文件呢? 例如: 如果js在html dom中添加了'script src = XXX'标签,我该如何提取src?

1 个答案:

答案 0 :(得分:0)

我想我会尝试使用无头浏览器来捕获每个网络调用而不是尝试解析代码。

我没有亲自使用它,但PhantomJS似乎符合要求。

它可用于加载网页,然后执行通常在请求上发生的任何脚本/ css,并在加载页面后执行填充。

network monitoring features可能是你想要使用的。