我需要手动解析网页中的所有相对网址

时间:2012-01-30 19:13:49

标签: javascript html url

好的,所以这个不幸的任务是由于我在另一个问题中确定的铬错误:Loading resources from html5 filesystem api

我需要做的是浏览下载网站可能带来的所有资源,并在Javascript中将任何相对网址转换为绝对网址。我可以使用的帮助是提出我将要处理的所有情况。这是我能想到的:

  • in html / xhtml / xml =>任何具有href或src属性的东西
  • in css =>与/url(.*)/ regex \
  • 相匹配的任何内容
  • javascript =>可能不可能......

还有什么我没想到的吗?

1 个答案:

答案 0 :(得分:1)

除非您使用jQuery或类似内容,否则我只会咬紧牙关并攻击整个页面源。

var entireHTML = document.documentElement.innerHTML;
document.documentElement.innerHTML = entireHTML.replace('href="','href="<path(/)>');

您如何确定由您决定,可以将其注入您的doc.onready函数或以其他方式将全局变量注入到文档中。