我试图通过rmongodb中的操作在组中执行求和。我求和的“列”包含NaN值,导致我的总和返回NaN。我想在运行group by命令之前使用$ project用零替换NaN,但是我被卡住了。
这将产生虚拟数据(在mongo控制台中):
db.NAtest.insert({ y : 1, x : 1})
db.NAtest.insert({ y : 1, x : 2})
db.NAtest.insert({ y : 2, x : 3})
db.NAtest.insert({ y : 2, x : 4})
db.NAtest.insert({ y : 2, x : NaN})
这将产生所需的结果(在mongo控制台中):
db.NAtest.aggregate( { $project : { y : 1,
x : { $cond : [ { $ne : ['$x', NaN] },
'$x',
0] } } } )
这就是我在R中的工作:
library(rmongodb)
mongo <- mongo.create()
buf <- mongo.bson.buffer.create()
mongo.bson.buffer.append(buf, "aggregate", "NAtest");
mongo.bson.buffer.start.array(buf, "pipeline")
mongo.bson.buffer.append.bson(buf,
"0",
mongo.bson.from.list(list('$project' = list(y = 1,
x= 1))))
mongo.bson.buffer.finish.object(buf)
cmd <- mongo.bson.from.buffer(buf)
result <- mongo.command(mongo, "rmdb", cmd)
当我尝试添加$ cond来转换NaN时,使用以下命令:
x = list("$cond" = c(list("$ne" = c("$x", as.numeric(NA))), "$x", "0"))
而不是
x = 1
不返回任何结果,mongo.get.err()返回值10,表示BSON无效。
如果在包含$ cond部分时在R会话中运行print(cmd),则会生成以下输出:
> print(cmd)
aggregate : 2 NAtest
pipeline : 4
0 : 3
$project : 3
y : 1 1.000000
x : 3
$cond : 3
$ne : 4
0 : 2 $x
1 : 2 NA
: 2 $x
: 2 0
我认为问题不在于NaN / as.numeric(NA)代码的一部分,因为当我尝试替换时将数字2表示为零时,我得到相同的错误。
提前致谢。
答案 0 :(得分:1)
似乎rmongodb在聚合时无法真正处理嵌入在其他运算符中的运算符。在$substr
中使用$group
时,我遇到了同样的问题。
在舞台上只尝试一个操作员。如果不可能,我可以推荐RMongo包作为替代方案。
dbAggregate(
mongo, "db", '{
$project : {
y : 1,
x : {$cond : [{ $ne : ['$x', NaN] }, '$x', 0]}
}
}')