MapReduce函数有两个不同的结果

时间:2013-02-16 19:19:22

标签: mongodb mapreduce

以下文件

{
    "_id" : ObjectId("511b7d1b3daee1b1446ecdfe"),
    "l_linenumber" : 1,
    "l_quantity" : 17,
    "l_extendedprice" : 21168.23,
    "l_discount" : 0.04,
    "l_tax" : 0.02,
    "l_returnflag" : "N",
    "l_linestatus" : "O",
    "l_shipdate" : ISODate("1996-03-13T03:00:00Z"),
    "l_commitdate" : ISODate("1996-02-12T03:00:00Z"),
    "l_receiptdate" : ISODate("1996-03-22T03:00:00Z"),
    "l_shipinstruct" : "DELIVER IN PERSON",
    "l_shipmode" : "TRUCK",
    "l_comment" : "blithely regular ideas caj",
}

我尝试了两种类似的地图缩减功能: 第一

db.runCommand({
    mapreduce: "lineitem",
    query: {
        l_shipdate: {'$gte': new Date("Jan 01, 1994")},
        l_shipdate: {'$lt': new Date("Jan 01, 1995")},
        l_discount: {'$gte':0.05},
        l_discount: {'$lte':0.07},
        l_quantity: {'$lt':24}
    },
    map : function Map() {
            var revenue = this.l_extendedprice * this.l_discount;
            emit("REVENUE", revenue);
        },
    reduce : function(key, values) {
                return Array.sum(values);
            },
    out: 'query006'
});

第二

db.runCommand({
    mapreduce: "lineitem",
    map : function Map() {
            var dataInicial = new Date("Jan 1, 1994");
            var dataFinal = new Date("Jan 1, 1995");

            if( this.l_discount>=0.05 && this.l_discount<=0.07 && this.l_quantity<24 && this.l_shipdate>=dataInicial && this.l_shipdate<dataFinal) {
                var produto = this.l_extendedprice * this.l_discount;
                emit("revenue", produto);
            }
        },
    reduce : function(key, values) {
                return Array.sum(values);
            },
    out: 'query006'

});

对我来说,两个函数都是等于的,并且可能返回相同的结果。但唯一的第二个回答正确答案。

这些函数是我尝试在TPC-H基准测试中转换SQL查询的存在。查询如下所示:

select
    sum(l_extendedprice*l_discount) as revenue
from 
    lineitem
where 
    l_shipdate >= date '1994-01-01'
    and l_shipdate < date '1994-01-01' + interval '1' year
    and l_discount between 0.06 - 0.01 and 0.06 + 0.01
    and l_quantity < 24;

为什么当我在第一个函数中使用查询语句时,结果大于正确的答案?这些功能确实相同吗?

1 个答案:

答案 0 :(得分:0)

我认为您的查询违反了$and operator documentation中的以下段落:

  

MongoDB在指定逗号分隔的表达式列表时提供隐式AND操作。例如,您可以将以上查询编写为:

     

db.inventory.find( { price: 1.99, qty: { $lt: 20 } , sale: true } )

     

但是,如果查询要求对同一字段(例如{ price: { $ne: 1.99 } } AND { price: { $exists: true } })执行AND操作,则要么使用$and运算符作为两个单独的表达式,要么合并字段{{的运算符表达式1}}。

如果我们遵循文档的建议,以下查询应该可以解决问题:

{ price: { $ne: 1.99, $exists: true } }