在异步瀑布中的第二个函数中,我的代码中的eachSeries
回调(urlCallback
)在瀑布回调(waterfallCallback
)之后执行,原因我无法理解。
async.waterfall([
function(callback) {
request(website, function (error, response, html) {
if (!error && response.statusCode == 200) {
pageUrls = getPageUrls(html)
callback(null, pageUrls)
}
})
},
function (pageUrls, waterfallCallback) {
async.eachSeries(pageUrls, function (url, urlCallback) {
console.log('SET ' + url)
request(url, function (err, response, body) {
var $ = cheerio.load(body)
$('#div').children().each(function(){
console.log($(this).children("a").attr("href"));
itemUrl = $(this).children("a").attr("href")
itemUrls.push(itemUrl)
})
urlCallback(null,itemUrls)
})
},
waterfallCallback(null, itemUrls))
}
],
function(err, results) {
console.log("results: " + results)
})
AFAIK,async.eachSeries接受三个参数(array,functionToBeExecuteOnEachItem,callback)并按顺序执行它们。不知何故不在这里。
答案 0 :(得分:3)
async.eachSeries
的参数是函数定义。类似于waterfallCallback
或function(err,result){}
。
当您调用waterfallCallback(null, itemUrls)
时,这不是函数定义,而是运行函数本身!
更改为简单waterfallCallback
应该可以解决问题。
更新:此外,.eachSeries
不会将值作为数组返回,其最终回调仅为function(err)
。结帐.mapSeries
link,这将返回最终回调function(err,finalArray)
中的结果数组。 (请注意,.map
的每次返回都是数组中的元素,因此如果返回数组,您将获得[ [], [], [] ]
)等数据结构