在插入大量数据时关闭node.js中的mongodb连接

时间:2013-09-15 15:44:06

标签: javascript node.js mongodb iis-logs

我正在尝试编写一个程序来解析并将iis日志数据插入到mongodb中。文件不是那么大,大约600行。与.net和sql server :)相比,试图说服我的管理nodejs和mongodb更好。 看一下nodejs中的下面代码。逻辑:我解析每一行并转换为json并在db中插入保存。我正在使用mongonative driver 问题:即使在所有行都插入Db之前,数据库连接也会关闭。
我看到日志文件有6000行,但db中的数量只有arnd 4000.我理解它是nodejs的异步特性,在这个如何以更确定的方式关闭连接(检查所有行是否插入后)?

var MongoClient = require('mongodb').MongoClient;
var mongoServer = require('mongodb').Server;
var serverOptions = {
    'auto_reconnect': true,
    'poolSize': 5
};

var fs = require('fs');
var readline = require('readline');

var rd = readline.createInterface({
    input: fs.createReadStream('C:/logs/Advisor_Metrics/UI/P20VMADVSRUI01/u_ex130904.log'),
    output: process.stdout,
    terminal: false
});
var mongoClient = new MongoClient(new mongoServer('localhost', 27017, serverOptions));
var db = mongoClient.db('test');
var collection = db.collection('new_file_test');
var cntr = 0;
mongoClient.open(function (err, mongoClient) {
    console.log(err);
    if (mongoClient)
    {        
        rd.on('line', function (line) {
            if (line.indexOf('#') == -1) {
                var lineSplit = line.split(' ');
                var data =
                {
                    d: lineSplit[0],
                    t: lineSplit[1],
                    sip: lineSplit[2],
                    met: lineSplit[3],
                    uri: lineSplit[4],
                    cip: lineSplit[8],
                    cua: lineSplit[9],
                    stat: lineSplit[10],
                    tt: lineSplit[13]
                };

                collection.insert(data, function (err, docs) {
                    console.log('closing connection');
                    //db.close();
                });
            }
        });
    }
})
rd.on('close', function () {
    db.close();
});

Sol 1:解决方案是解析json对象并添加到数组中并将数组添加到mongodb。我不想那样做,因为那会将整个巨大的日志文件解析到内存中!还有其他任何解决方案吗?

1 个答案:

答案 0 :(得分:1)

我100%肯定,但据我所知,您正在插入数据同步。我的意思是,一旦你得到一条线,你试图插入它并且不要等待结果。尝试使用其他方法:

  • 读取所有行并将它们存储在数组中
  • 开始逐行插入数据

类似的东西:

var lines = [];
var readAllLines = function(callback) {
    // store every line inside lines array
    // and call the callback at the end
    callback();
}
var storeInDb = function(callback) {
    if(lines.length === 0) {
        callback();
        return;
    }
    var line = lines.shift();
    collection.insert(line, function (err, docs) {
        storeInDb(callback);
    });
}

mongoClient.open(function (err, mongoClient) {
    console.log(err);
    if (mongoClient) {
        readAllLines(function() {
            storeInDb(function() {
                // lines are inserted
                // close the db connection
            })
        });
    }
});