好的我不会使用js知道,但是有没有办法用它来获取页面的真实源代码?
例如,document.body.innerHTML提供了某种“修复”版本,其中删除了格式错误的标签。
我猜测在原始页面上使用XMLHttpRequest可能会有效,但似乎有些愚蠢。
答案 0 :(得分:4)
这是因为浏览器解析DOM并且不将HTML保留在内存中。返回给您的是浏览器将当前DOM转换回HTML,这是大写标签和缺少自闭标签的原因。
XMLHttpRequest将是最好的方式。在大多数情况下,假设服务器没有发送no-cache标头,并且HTML页面已经完成下载,XMLHttpRequest几乎是即时的,因为文件是从缓存中提取的。
答案 1 :(得分:3)
为了访问相同来源的JS,XMLHttpRequest非常好。您可以使用此技术以“原始”格式访问任何JS文档,而不会妨碍浏览器(即转换为DOM并返回)。
我不确定我理解您的评论: XMLHttpRequest是愚蠢的:是因为您担心可能的重复工作?即从原始服务器获取代码2次。
答案 2 :(得分:2)
当我想要仔细阅读或复制源文件时,我通常会使用FireBug。