我有以下代码例程,效果很好。唯一的问题是我需要结果以links
数组的相同顺序返回。例如,我需要google.com链接的结果首先返回,然后是yahoo等。代码当前返回"随机"顺序。
var Nightmare = require('nightmare');
var async = require('async');
var links = [
"http://www.google.com",
"http://www.yahoo.com",
"http://www.bing.com",
"http://www.aol.com",
"http://duckduckgo.com",
"http://www.ask.com"
];
var scrape = function(url, callback) {
var nightmare = new Nightmare();
nightmare.goto(url);
nightmare.wait('body');
nightmare.evaluate(function () {
return document.querySelector('body').innerText;
})
.then(function (result) {
console.log(url, result);
})
nightmare.end(function() {
callback();
});
}
async.map(links, scrape);
更新: 谢谢@christophetd。这是我修改后的工作代码:
var Nightmare = require('nightmare');
var async = require('async');
var links = [
"http://www.google.com",
"http://www.yahoo.com",
"http://www.bing.com",
"http://www.aol.com",
"http://duckduckgo.com",
"http://www.ask.com"
];
var scrape = function(url, callback) {
var nightmare = new Nightmare();
nightmare.goto(url);
nightmare.wait('body');
nightmare.evaluate(function () {
return document.querySelector('body').innerText;
})
.then(function (result) {
callback(null, url+result);
});
nightmare.end();
}
async.map(links, scrape, function (err, results) {
if (err) return console.log(err);
console.log(results);
})
答案 0 :(得分:3)
来自the official async documentation:
结果数组的顺序与原始集合的顺序相同
这很容易验证:
// This function waits for 'number' seconds, then calls cb(null, number)
var f = function (number, cb) {
setTimeout(function () {
cb(null, number)
}, number * 1000)
}
async.map([4, 3, 2, 1], f, function (err, results) {
console.log(results); // [4, 3, 2, 1]
})
正如您在上面的代码中看到的那样,即使4
处理参数f
比花费3
花费的时间更多,它仍然会在结果中排在第一位
如果是您的代码,请写下:
async.map(links, scrape, function (err, results) {
if (err) {
// handle error, don't forget to return
}
// results will be in the same order as 'links'
})
应该给你预期的结果。