我已使用实际代码更新了帖子。
问题是节点应用程序挂起并且不会退出,除非我在addArticle中注释掉查询。我很想知道我在这里做错了什么(关于悬挂问题)。
function addArticle(title, text, date, link) {
connection.query("SELECT * FROM articles WHERE link LIKE "+connection.escape(link), function(error, rows, fields) {
if(rows.length == 0) {
console.log("article not in database");
console.log(connection.escape(title));
var values = [connection.escape(title), connection.escape(text), date, connection.escape(link), '{}'];
connection.query("INSERT INTO articles (title, text, date, link, topics) VALUES ?", [[values]], function(err) {
if(err) throw err;
});
}
});
}
function scrapeReuters() {
var url = 'http://www.reuters.com/news/archive/technologyNews?date=10092013';
request(url, function(err, resp, body){
$ = cheerio.load(body);
links = $('a');
$(links).each(function(i, link){
var addr = $(link).attr('href');
if(addr != undefined && addr.indexOf('article') != -1 && addr.indexOf('http') == -1 ) {
var full_link = "http://www.reuters.com"+addr;
var title = $(link).text();
request(full_link, function(err, resp, body){
$ = cheerio.load(body);
para = $('p').text();
addArticle(title, para,new Date().getTime(), full_link);
});
}
});
});
}
答案 0 :(得分:0)
您可能需要在所有查询完成后关闭连接。您可以尝试使用https://github.com/caolan/async库按顺序运行查询,然后在主回调中关闭连接。
它有点棘手,但首先你需要定义一个要执行的函数数组。然后运行async.sequence(arrayOfFns,masterCallback)。主回调得到错误和结果(注意复数,它来自所有函数)。在该主回调中,终止mysql连接/并结束该过程。
为此,我会重写addArticle查询以返回查询字符串。然后在$(links).each
循环之前,我会创建一个名为toInsert
在每个循环中我会说
toInsert.push(function(callback) {
connection.query(addArticle(...),function(err) {
if(err) callback(err);
else callback(null,true);
});
});
然后循环运行
async.sequence(toInsert,function(errs,results) {
connection.close() //not sure if correct
process.exit(); //maybe, if needed?
});