page.evaluate(function() { return document; }, function(result){
console.log(result)
next();
});
结果实际上是一个巨大的目标。我不知道该对象的属性和属性。我只想要页面的as you would see it in Chrome inspector
。
从对象的外观来看,似乎HTML包含CSS和javascript ......这很奇怪。用户不应该看到CSS和javascript,因为它们不是网页的HTML。那些是外部文件。我只想要用户看到的HTML。
答案 0 :(得分:7)
document
的类型是HTML文档。要将整个DOM作为字符串,您可以document.documentElement.outerHTML
。
从evaluate
外部,您可以使用page.content
。这是一个字符串。
我不知道“HTML包含CSS和JavaScript”或“网页的HTML”是什么意思。您是指脚本编辑修改的页面源和DOM之间的区别吗?以上两个都为您提供了当前的DOM,而不是原始页面源。