Question

我正在尝试将页面源与doctype，head和body一起获取。

window.content.document是文档，但除了不包含doctype的innerHTML之外，我无法收集任何内容。

Answer 1

不包括DOCTYPE，因为它不是文档元素的子元素，而是文档本身的直接子元素。您可以使用XML序列化程序序列化整个文档：

var serializer = new XMLSerializer();
alert(serializer.serializeToString(window.content.document));

这将进行XML序列化 - 与HTML不完全相同。如果这是一个问题，您可以浏览window.content.document.childNodes集合并获取node.innerHTML元素节点（node.nodeType == 1），只对其余部分使用XMLSerializer。有关详细信息，请参阅https://developer.mozilla.org/en/XMLSerializer。

在Firefox Addon中获取整个页面源

1 个答案: