我正在尝试将页面源与doctype,head和body一起获取。
window.content.document是文档,但除了不包含doctype的innerHTML之外,我无法收集任何内容。
答案 0 :(得分:1)
不包括DOCTYPE,因为它不是文档元素的子元素,而是文档本身的直接子元素。您可以使用XML序列化程序序列化整个文档:
var serializer = new XMLSerializer();
alert(serializer.serializeToString(window.content.document));
这将进行XML序列化 - 与HTML不完全相同。如果这是一个问题,您可以浏览window.content.document.childNodes
集合并获取node.innerHTML
元素节点(node.nodeType == 1
),只对其余部分使用XMLSerializer
。有关详细信息,请参阅https://developer.mozilla.org/en/XMLSerializer。