我最近开始使用horseman.js来删除带节点的页面。我无法弄清楚它是如何工作的,我无法在网上找到好的例子。
我的主要目标是登录平台并提取一些数据。我设法用PhantomJS做了这个,但知道我想学习如何用horseman.JS。
我的代码应该打开登录页面,填写登录名和密码输入,然后单击“登录”按钮。到目前为止很容易。但是,点击“登录”按钮后,网站会在加载我想要工作的实际页面之前进行2次重定向。
我的问题是我不知道如何让我的代码等待该页面。
使用phantomJS,我有一个页面URL的解决方法。以下代码显示了我是如何使用phantomJS设法完成的,它运行得很好:
var page = require('webpage').create();
var urlHome = 'http://akna.com.br/site/montatela.php?t=acesse&header=n&footer=n';
var fillLoginInfo = function(){
$('#cmpLogin').val('mylogin');
$('#cmpSenha').val('mypassword');
$('.btn.btn-default').click();
};
page.onLoadFinished = function(){
var url = page.url;
console.log("Page Loaded: " + url);
if(url == urlHome){
page.evaluate(fillLoginInfo);
return;
}
// After the redirects the url has a "sid" parameter, I wait for that to apear when the page loads.
else if(url.indexOf("sid=") >0){
//Keep struggling with more codes!
return;
}
}
page.open(urlHome);
但是,我找不到用horseman.JS处理重定向的方法。
以下是我一直在尝试使用horseman.JS而没有任何成功:
var Horseman = require("node-horseman");
var horseman = new Horseman();
var urlHome = 'http://akna.com.br/site/montatela.php?t=acesse&header=n&footer=n';
var fillLoginInfo = function(){
$('#cmpLogin').val('myemail');
$('#cmpSenha').val('mypassword');
$('.btn.btn-default').click();
}
var okStatus = function(){
return horseman.status();
}
horseman
.open(urlHome)
.type('input[name="cmpLogin"]','myemail')
.type('input[name="cmpSenha"]','mypassword')
.click('.btn-success')
.waitFor(okStatus, 200)
.screenshot('image.png')
.close();
如何处理重定向?
答案 0 :(得分:1)
我目前正在解决同样的问题,到目前为止,我最好的解决方案是使用waitForSelector方法在最终页面上定位。
E.g。
horseman
.open(urlHome)
.type('input[name="cmpLogin"]','myemail')
.type('input[name="cmpSenha"]','mypassword')
.click('.btn-success')
.waitForSelector("#loginComplete")
.screenshot('image.png')
.close();
当然,您必须知道您正在等待执行此操作的页面。
如果您知道有两个重定向,则可以使用.waitForNextPage()
两次的方法。一个天真的方法,如果你不知道有多少重定向会链接到这些重定向,直到达到超时(我不推荐这个,因为它会很慢!),
也许是一种更聪明的方式,您也可以使用on
个事件来捕获重定向,例如.on('navigationRequested')
或.on('urlChanged')
。
虽然它没有直接回答您的问题,但此链接可能有所帮助:https://github.com/ariya/phantomjs/issues/11507