使用Phantom.js评估,我如何获取页面的HTML?

时间:2013-05-23 06:15:18

标签: javascript html node.js backbone.js phantomjs

page.evaluate(function() { return document; }, function(result){    
    console.log(result)                    
    next();
});

结果实际上是一个巨大的目标。我不知道该对象的属性和属性。我只想要页面的as you would see it in Chrome inspector

从对象的外观来看,似乎HTML包含CSS和javascript ......这很奇怪。用户不应该看到CSS和javascript,因为它们不是网页的HTML。那些是外部文件。我只想要用户看到的HTML。

1 个答案:

答案 0 :(得分:7)

document的类型是HTML文档。要将整个DOM作为字符串,您可以document.documentElement.outerHTML

evaluate外部,您可以使用page.content。这是一个字符串。

我不知道“HTML包含CSS和JavaScript”或“网页的HTML”是什么意思。您是指脚本编辑修改的页面源和DOM之间的区别吗?以上两个都为您提供了当前的DOM,而不是原始页面源。