如果我使用wget,并从URL获取html文件。如何从该HTML文件生成HAR文件。
如果可能,请建议C,C ++或Java实现。
答案 0 :(得分:5)
HAR格式的主要目的是拥有许多工具可以使用和分析的标准HTTP跟踪格式。换句话说,它的原始意图主要是,对于性能分析,不是“归档”网页本身。
如果您使用wget
获取某个网页,则会丢失99%的所有效果数据。要捕获必要的数据,您确实需要一个浏览器来执行请求,获取所有相关资源,保存所有计时器等。这将使您能够构建瀑布图等。
如果你需要在服务器上捕获这些数据,那么你可以使用pcap捕获TCP跟踪然后convert that to HAR,尽管你仍然需要一个实际解析HTML并请求所有子的客户端资源(pcap只是在后台监听)。或者,您可以路由浏览器through a proxy并让它为您吐出一个HAR文件。
最后但并非最不重要的是,您可以通过其调试界面驱动浏览器并以此方式导出HAR文件。用于驱动Firefox的Java示例:https://github.com/Filirom1/browsermob-page-perf