我是第一次尝试PhantomJS,并希望下载一个带有PHP的远程站点用于搜索引擎优化目的。
我已成功下载HTML内容,但页面总是“未启用Javascript”后备。从这里我只能得出结论,PhantomJS正在访问没有Javascript支持的网站..我已经发布了我目前正在使用的脚本,这应该是非常标准的。有没有人知道使用PhantomJS返回远程HTML内容的更好方法?
phantom.js
var page = require('webpage').create();
var system = require('system');
var url = system.args[1];
page.open(url,
function(status){
if (status !== 'success') {
phantom.exit(1);
return;
} else {
page.evaluate(
function() {
return document.documentElement.outerHTML;
},
function(result){
console.log(result);
});
}
phantom.exit();
});
的index.php
$url = escapeshellarg('<some url to test>');
$script = "phantom.js";
$contents = shell_exec("/usr/local/bin/phantomjs $script $url");
答案 0 :(得分:0)
如何简单地使用page.content
?这有用吗:
var page = require('webpage').create();
var system = require('system');
var url = system.args[1];
page.open(url,
function(status){
if (status !== 'success') {
console.log("FAILED:"+status);
}
else{
console.log(page.content);
}
phantom.exit();
});