我在MongoDB集合中有大约30,000个文档。并且一直停留在开发node.js脚本以仅检索具有特定字符串键值对的记录。
MongoDB服务器上的这个查询返回了我一直在寻找的确切结果:
db.getCollection('posts').find({authorName: "Ashwin-kumar"})
立即给我回复约33份文件。同样地,我有大约40位不同名字的作者。
这是我的node.js脚本,用于按authorName检索帖子(是的,它基于Name,一个字符串,因为这些作者没有ID :():
var fs = require('fs'),
request = require('request'),
async = require("async"),
assert = require('assert');
_ = require('lodash'),
MongoClient = require('mongodb').MongoClient;
var db, postsCollection, postCol;
async.series([dbConnect, checkCollection, createMeta, dbClose], function(){
console.log("Executed all calls in series.");
process.exit(0);
});
function dbConnect(callback){
MongoClient.connect("mongodb://localhost:27017/jPosts", function(pErr, pDb) {
if(pErr) {
console.dir(pDb);
return 0;
}
db = pDb;
callback();
});
}
function dbClose(callback){
db.close(true, function (err) {
if (err) console.error(err);
else console.log("close complete");
callback();
});
}
function checkCollection(callback) {
db.collection('posts', function(err, collection) {});
postsCollection = db.collection('posts');
postCol = db.collection('posts');
callback();
}
function createMeta(callback){
var meta = [];
postsCollection.aggregate([
{
$group : {_id : "$authorName"}
}]).toArray(function(err, result) {
assert.equal(err, null);
async.forEachLimit(result, 1, function(pPost, callback) {
getPosts(pPost._id, callback);
}, function(err) {
console.log(err);
callback();
});
});
}
function getPosts(pAuthor, callback){
var cursor = postCol.find({ "authorName": pAuthor});
cursor.toArray(function(err,items){
if(err)
callback(err);
else
callback(null, items);
});
}
这对我来说似乎不起作用。 cursor.toArray()除了永远等待之外什么都不做。是因为每个文件中的字段太多了吗?
我试图获取光标获取的文档数,但效果很好。
function getPosts(pAuthor, callback){
var cursor = postCol.find({ "authourName": pAuthor});
cursor.count().then(function(items_count) {
console.log(items_count);
callback();
});
}
另外,我尝试使用游标的.each方法来迭代所提取的文档。但还没有运气。
function getPosts(pAuthor, callback){
var cursor = postCol.find({ "authourName": pAuthor});
cursor.each(function(err, doc) {
assert.equal(err, null);
if (doc != null) {
console.dir(doc);
} else {
console.log(err);
}
});
}
我在这里遗漏了什么吗?还有什么办法让这项工作成功?我使用异步的方式有什么问题吗?
P.S:这里的想法是查询转储并为jPost集合中的authours生成PDF。
P.S 2:这是一份样本文件
{
"_id" : ObjectId("571d36b55672f713fe346a66"),
"id" : 56517,
"authorName" : "Ashwin-kumar",
"comment_count" : 380,
"tagline" : "... Opinions you don't really need",
"vote_count" : 5152,
"exclusive" : null,
"post": [
],
"post_comments" : [
//comment_count objects
],
"date" : "2016-03-27"
}
(为了简洁起见,我省略了post& post_comments部分。)
答案 0 :(得分:1)
试试这个:
var collection = db.collection("collection_name");
collection.find({authourName: "Ashwin-kumar"}).toArray(function (err,items) {
if (err) {
console.dir(err);
} else {
//do something with items array
console.dir(items);
}
});
答案 1 :(得分:0)
您是否检查过getPosts中pAuthor的价值是什么?因为当你进行聚合时,你会收到一个带有_id字段(而不是authourName)的对象集合,所以你应该这样做:
// not sure why you need meta array, at least it's not used in the code you provided
meta.push({
author: pPost._id
});
getPosts(pPost._id, callback);