网页抓取-无法获取页面源代码

时间:2019-07-04 10:18:38

标签: php web-scraping phantomjs

我想获取一个网站的页面来源,可以放置该网站的地址吗?我使用PHP进行抓取,问题是我无法获取页面源代码,我也尝试使用phantomjs,我从PHP代码中调用此脚本:

var system = require('system');
var args = system.args;

if (args.length === 1) {
  console.log('Try to pass some arguments when invoking this script!');
} 
else {
    var page = require('webpage').create();
    page.settings.userAgent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.2062'
    page.open(args[1], function(status) {
        page.onLoadFinished = function(status){
            console.log(page.content);
            phantom.exit();
        };
    });
}

但是每次我只收到空白页面时,我也尝试使用luminati代理,但是它不起作用,有人知道我还能尝试什么吗?

0 个答案:

没有答案