在解析之前执行网页中的所有javascript

时间:2015-01-03 15:43:58

标签: java javascript html parsing jsoup

我想下载包含一些javascript的网页的html。如果我使用像jsoup这样的库,我会获得没有javascript生成的元素的html。

如何获取javascript执行后获得的html?

编辑:如何在Java程序的答案中使用该脚本?

1 个答案:

答案 0 :(得分:3)

您可以将PhantomJS与以下脚本一起使用:

var page = require('webpage').create();
page.open('http://stackoverflow.com',function(status){
  if(status !== 'success'){
    console.log('Open failed');
  }else{
   console.log(page.evaluate(function(){
                               return document.documentElement.outerHTML;
                             }));
  }
  phantom.exit();
});

如果要从Java执行此脚本,请阅读以下内容:

Running Phantomjs from javascript, JSP or Java