如何使用HorsemanJs和PhantomJS处理Node.JS中的重定向

时间:2016-02-25 16:22:25

标签: javascript node.js phantomjs

我最近开始使用horseman.js来删除带节点的页面。我无法弄清楚它是如何工作的,我无法在网上找到好的例子。

我的主要目标是登录平台并提取一些数据。我设法用PhantomJS做了这个,但知道我想学习如何用horseman.JS。

我的代码应该打开登录页面,填写登录名和密码输入,然后单击“登录”按钮。到目前为止很容易。但是,点击“登录”按钮后,网站会在加载我想要工作的实际页面之前进行2次重定向。

我的问题是我不知道如何让我的代码等待该页面。

使用phantomJS,我有一个页面URL的解决方法。以下代码显示了我是如何使用phantomJS设法完成的,它运行得很好:

var page = require('webpage').create();

var urlHome = 'http://akna.com.br/site/montatela.php?t=acesse&header=n&footer=n';

var fillLoginInfo = function(){
    $('#cmpLogin').val('mylogin');
    $('#cmpSenha').val('mypassword');
    $('.btn.btn-default').click();
};

page.onLoadFinished = function(){

    var url = page.url;
    console.log("Page Loaded: " + url);

    if(url == urlHome){
        page.evaluate(fillLoginInfo);
        return;
    }

   // After the redirects the url has a "sid" parameter, I wait for that to apear when the page loads.
   else if(url.indexOf("sid=") >0){
    //Keep struggling with more codes!
    return;
}

}

page.open(urlHome);

但是,我找不到用horseman.JS处理重定向的方法。

以下是我一直在尝试使用horseman.JS而没有任何成功:

var Horseman = require("node-horseman");
var horseman = new Horseman();

var urlHome = 'http://akna.com.br/site/montatela.php?t=acesse&header=n&footer=n';

var fillLoginInfo = function(){
  $('#cmpLogin').val('myemail');
  $('#cmpSenha').val('mypassword');
  $('.btn.btn-default').click();
}

var okStatus = function(){
  return horseman.status();
}

horseman
  .open(urlHome)
  .type('input[name="cmpLogin"]','myemail')
  .type('input[name="cmpSenha"]','mypassword')
  .click('.btn-success')
  .waitFor(okStatus, 200)
  .screenshot('image.png')
  .close();

如何处理重定向?

1 个答案:

答案 0 :(得分:1)

我目前正在解决同样的问题,到目前为止,我最好的解决方案是使用waitForSelector方法在最终页面上定位。

E.g。

horseman
  .open(urlHome)
  .type('input[name="cmpLogin"]','myemail')
  .type('input[name="cmpSenha"]','mypassword')
  .click('.btn-success')
  .waitForSelector("#loginComplete")
  .screenshot('image.png')
  .close();

当然,您必须知道您正在等待执行此操作的页面。

如果您知道有两个重定向,则可以使用.waitForNextPage()两次的方法。一个天真的方法,如果你不知道有多少重定向会链接到这些重定向,直到达到超时(我不推荐这个,因为它会很慢!),

也许是一种更聪明的方式,您也可以使用on个事件来捕获重定向,例如.on('navigationRequested').on('urlChanged')

虽然它没有直接回答您的问题,但此链接可能有所帮助:https://github.com/ariya/phantomjs/issues/11507