所以我在一个JS很重的网站上进行一些屏幕抓取。它使用客户端模板引擎呈现所有内容。我尝试使用jQuery并且在控制台中工作,但显然不是在服务器(Nodejs)上。
我查看了一些Python和Java的库,他们似乎能够处理我想要的东西,但我更喜欢与Node服务器一起使用的JS解决方案。
有没有办法在使用Node? p>渲染页面之后获取完整的页面源
答案 0 :(得分:2)
答案 1 :(得分:1)
答案 2 :(得分:1)
我使用jsdom进行屏幕抓取,代码就在这里......
var jsdom = require( 'jsdom' );
jsdom.env( {
url: <give_url_of_page_u_want_to_scarpe>,
scripts: [ "http://code.jquery.com/jquery.js" ],
done: function( error, window ) {
var $ = window.$;
// required page is loaded in $....
//you can write any javascript or jquery code get what ever you want
}
} );