瀑布中嵌套的async.eachSeries执行顺序错误

时间:2016-09-16 14:58:52

标签: node.js asynchronous request waterfall

在异步瀑布中的第二个函数中,我的代码中的eachSeries回调(urlCallback)在瀑布回调(waterfallCallback)之后执行,原因我无法理解。

   async.waterfall([
      function(callback) {
        request(website, function (error, response, html) {
            if (!error && response.statusCode == 200) {
              pageUrls = getPageUrls(html)
              callback(null, pageUrls)
            }
          })
      },
      function (pageUrls, waterfallCallback) {
          async.eachSeries(pageUrls, function (url, urlCallback) {
              console.log('SET ' + url)
              request(url, function (err, response, body) {
                  var $ = cheerio.load(body)
                  $('#div').children().each(function(){
                    console.log($(this).children("a").attr("href"));
                    itemUrl = $(this).children("a").attr("href")
                    itemUrls.push(itemUrl)
                  })
                  urlCallback(null,itemUrls)
              })
          },
          waterfallCallback(null, itemUrls))
      }
    ],
      function(err, results) {
        console.log("results: " + results)
    })

AFAIK,async.eachSeries接受三个参数(array,functionToBeExecuteOnEachItem,callback)并按顺序执行它们。不知何故不在这里。

1 个答案:

答案 0 :(得分:3)

async.eachSeries的参数是函数定义。类似于waterfallCallbackfunction(err,result){}

当您调用waterfallCallback(null, itemUrls)时,这不是函数定义,而是运行函数本身!

更改为简单waterfallCallback应该可以解决问题。

更新:此外,.eachSeries不会将值作为数组返回,其最终回调仅为function(err)。结帐.mapSeries link,这将返回最终回调function(err,finalArray)中的结果数组。 (请注意,.map的每次返回都是数组中的元素,因此如果返回数组,您将获得[ [], [], [] ])等数据结构