我有一个rails应用程序。它存储各种页面的网址。现在我想获得这些页面的大小(以及这些页面的js,css和图像)。最好的方法是什么? 我试图卷曲或wget页面并找到内容长度标题信息,但我猜内容长度不会给出页面大小(它只是http响应的主体长度)。
任何帮助都将受到高度赞赏。
答案 0 :(得分:0)
这有点矫枉过正,但你可以使用Nokogiri(https://github.com/tenderlove/nokogiri/),至少可以获得身体标签中的字符数......
doc = Nokogiri.parse(open('http://example.com'))
body = doc.search('body').first
body.content.length