我想下载包含一些javascript的网页的html。如果我使用像jsoup这样的库,我会获得没有javascript生成的元素的html。
如何获取javascript执行后获得的html?
编辑:如何在Java程序的答案中使用该脚本?
答案 0 :(得分:3)
您可以将PhantomJS与以下脚本一起使用:
var page = require('webpage').create();
page.open('http://stackoverflow.com',function(status){
if(status !== 'success'){
console.log('Open failed');
}else{
console.log(page.evaluate(function(){
return document.documentElement.outerHTML;
}));
}
phantom.exit();
});
如果要从Java执行此脚本,请阅读以下内容: