我从网站上提取数据。被拉出的数据被贬低。向第一页发出请求时,会收到包含nextCursor
的响应。必须使用此光标来获取第2页的结果。每个页面请求都需要nextCursor
。
我正在努力使用Promises实现这一点,因为我无法找到任何循环方式。这就是我假设它没有Promises的方式(未经过测试,但它展示了我尝试做的事情):
let nextCursor = argv.initalCursor
do {
let r = request('http://example.com/items.php?cursor=' + nextCursor, function(err, resp, body) {
if(err) throw new Error(err)
// Do something with the data
nextCursor = JSON.parse(body)['nextCursor']
})
} while(nextCursor)
正如您所看到的,循环中的迭代次数未知。它将循环,直到响应中没有nextCursor
。
我想要做的是使用Promises实现这一点。除非我不知道如何创建一个以类似方式工作的循环,因为每个请求都依赖于最后一个请求。
如何使用promises工作?
这是我目前在return self.cursorRequest
时失败的解决方案。该剧本暂停执行。
'use strict'
let Promise = require('bluebird')
let _ = require('lodash')
class Event {
constructor(session) {
this.session = session
this.scrapedIDs = [] // I don't like this!
}
parseGuestsAndCursor(json, guestType) {
let ids = json['payload'][guestType]['sections'][2][1].map(function(user) {
return user['uniqueID']
})
return {
ids: _.uniq(ids),
cursor: json['payload'][guestType]['cursor']
}
}
cursorRequest(cursor, eventID, guestType) {
let self = this
return new Promise(function(resolve, reject) {
let url = `https://example.com/events/typeahead/guest_list/?event_id=${eventID}&tabs[0]=${guestType}&order[${guestType}]=affinity&bucket_schema[${guestType}]=friends&cursor[${guestType}]=${cursor}&dpr=1&__user=${self.session.uid}&__a=1`
self.session.request(url, function(err, resp, body) {
if(err) reject(err)
let json
try {
json = JSON.parse(body.substring(9))
} catch(err) {
reject(err)
}
resolve(self.parseGuestsAndCursor(json, guestType))
})
})
}
members(eventID, limit, guestType) {
let self = this
let ids = []
return new Promise(function(resolve, reject) {
let url = `https://example.com/events/typeahead/guest_list/?event_id=${eventID}&tabs[0]=watched&tabs[1]=going&tabs[2]=invited&order[declined]=affinity&order[going]=affinity&order[invited]=affinity&order[maybe]=affinity&order[watched]=affinity&order[ticket_purchased]=affinity&bucket_schema[watched]=friends&bucket_schema[going]=friends&bucket_schema[invited]=friends&bucket_schema[ticket_purchased]=friends&dpr=1&__user=${self.session.uid}&__a=1`
self.session.request(url, function(err, resp, body) {
if(err) reject(new Error(err))
let json, guests
try {
json = JSON.parse(body.substring(9))
guests = self.parseGuestsAndCursor(json, guestType)
} catch(err) {
reject(err)
}
self.cursorRequest(guests.cursor, eventID, guestType).then(function(guests) {
self.scrapedIDs.concat(guests.ids).map(function(user) {
return user['uniqueID']
})
if(guests.cursor) {
return self.cursorRequest(guests.cursor, eventID, guestType)
}
else {
resolve(self.scrapedIDs)
}
})
})
})
}
}
module.exports = Event
答案 0 :(得分:3)
由于该过程是异步的,因此根本不使用循环结构;你只需使用一个自我调用的函数(间接通过另一个函数)。
在你的情况下,既然你已经说过要用promises来实现这个,那你就是这样做的(最容易在代码中实际表达);
var p = new Promise(function(resolve, reject) {
let nextCursor = argv.initialCursor;
doRequest();
function doRequest() {
request('http://example.com/items.php?cursor=' + nextCursor, handleResult);
}
function handleResult(err, resp, body) {
if (err) {
// Got an error, reject the promise
reject(err);
} else {
// Do something with the data
// Next?
nextCursor = JSON.parse(body)['nextCursor'];
if (nextCursor) {
// Yup, do it
doRequest();
} else {
// No, we're done
resolve(/*...resolution value here...*/);
}
}
}
});
(ES2015版本看起来基本相同。)
答案 1 :(得分:1)
另一种方法是宣传你正在使用的异步函数,并在此基础上进行构建。
这种方法的好处是功能是模块化的,所以如果你想用promises制作其他类型的请求,你可以重用makeRequest()
函数:
let nextCursor = argv.initalCursor
function requestPromise(url) {
return new Promise(function (resolve, reject) {
request(url, function (err, resp, body) {
if (err) { reject(new Error(err)); }
else { resolve({ resp: resp, body: body}); }
});
});
}
function queryCursor(cursor) {
return requestPromise('http://example.com/items.php?cursor=' + cursor)
.then(function (result) {
// do something with result
var nextCursor = JSON.parse(result.body).nextCursor;
if (nextCursor) {
return queryCursor(nextCursor);
}
});
}
queryCursor(nextCursor)
.catch(function (err) {
// deal with err
});