如何从HTML文件生成HAR文件?

时间:2012-05-12 10:39:57

标签: html pagespeed har

如果我使用wget,并从URL获取html文件。如何从该HTML文件生成HAR文件。

  1. 从html文件生成har文件的任何开源实现?
  2. 生成HAR文件后,我可以使用harlib从HAR文件中读取数据。
  3. 如果可能,请建议C,C ++或Java实现。

1 个答案:

答案 0 :(得分:5)

HAR格式的主要目的是拥有许多工具可以使用和分析的标准HTTP跟踪格式。换句话说,它的原始意图主要是,对于性能分析,不是“归档”网页本身。

如果您使用wget获取某个网页,则会丢失99%的所有效果数据。要捕获必要的数据,您确实需要一个浏览器来执行请求,获取所有相关资源,保存所有计时器等。这将使您能够构建瀑布图等。

如果你需要在服务器上捕获这些数据,那么你可以使用pcap捕获TCP跟踪然后convert that to HAR,尽管你仍然需要一个实际解析HTML并请求所有子的客户端资源(pcap只是在后台监听)。或者,您可以路由浏览器through a proxy并让它为您吐出一个HAR文件。

最后但并非最不重要的是,您可以通过其调试界面驱动浏览器并以此方式导出HAR文件。用于驱动Firefox的Java示例:https://github.com/Filirom1/browsermob-page-perf