如何从HTML识别静态资产

时间:2018-08-13 14:14:48

标签: html static-files

我的任务是列出网页中的所有静态资产。我知道静态资产是那些在运行时永不更改的文件。

是否有系统的方法将它们与动态文件区分开?

如果我必须列出所有静态资产。最好的起点是什么?

1 个答案:

答案 0 :(得分:1)

从客户端的角度来看,没有系统的方法来确定html响应的哪一部分来自静态文件或由服务器在运行时生成。 html标准没有什么区别。

话虽这么说,大多数时候,您可以猜测响应的哪一部分来自静态文件。当html用指向.css,.js,.gif等文件的链接进行响应时,很有可能来自静态文件。

但是无法确定哪个html元素来自磁盘上的文件,哪个是在运行时构建的。

系统的方法是分析形成html响应的代码,并从中确定哪些资源是静态的,哪些资源是动态的。

修改 您补充说,您不必是100%。如果不需要,则可以使用cloudflare's list of file extentions。 cloudflare默认情况下会缓存这些扩展的原因是它们通常是静态的。