使用PhantomJS访问网站

时间:2013-11-20 01:40:30

标签: php phantomjs


我是第一次尝试PhantomJS,并希望下载一个带有PHP的远程站点用于搜索引擎优化目的。

我已成功下载HTML内容,但页面总是“未启用Javascript”后备。从这里我只能得出结论,PhantomJS正在访问没有Javascript支持的网站..我已经发布了我目前正在使用的脚本,这应该是非常标准的。有没有人知道使用PhantomJS返回远程HTML内容的更好方法?

phantom.js

var page = require('webpage').create();
var system = require('system');
var url = system.args[1];

page.open(url,
    function(status){
        if (status !== 'success') {
            phantom.exit(1);
            return;
        } else {
            page.evaluate(
                function() { 
                    return document.documentElement.outerHTML;
                }, 
                function(result){
                    console.log(result);
                }); 
        }
        phantom.exit();
    });

的index.php

$url = escapeshellarg('<some url to test>');
$script = "phantom.js";
$contents = shell_exec("/usr/local/bin/phantomjs $script $url");

1 个答案:

答案 0 :(得分:0)

如何简单地使用page.content?这有用吗:

var page = require('webpage').create();
var system = require('system');
var url = system.args[1];

page.open(url,
    function(status){
        if (status !== 'success') {
            console.log("FAILED:"+status);
            } 
        else{
            console.log(page.content);
            } 
        phantom.exit();
    });