Mongo Map第一次减少

时间:2010-06-09 02:57:01

标签: php mongodb mapreduce mongodb-php

首次在此处映射/减少用户,并使用MongoDB。我有很多页面访问数据,我想通过使用Map / Reduce来了解一些。下面基本上是我想要做的,但作为一个初学者Map / Reduce,我认为这超出了我的知识!

  1. 浏览过去30天内访问过的所有网页,以及external = true。
  2. 然后为每个页面找到所有访问次数
  3. 按引荐位置对所有访问进行分组
  4. 对于每个推介位置,计算访问具有特定“类型”且在“标签”中还有特定字词的页面的数量。
  5. 数据库和集合按

    组织
    $mongo->dbname->visits
    

    示例文档是:

    {"url": "www.example.com", "type": "a", "refer": {"external": true, "domain": "twitter.com", "url": "http://www.twitter.com/page"}, "page": "1235", "user": "1232", "time": 1234567890}
    

    然后我想找到带有特定标签的B类文件。

    {"url": "www.example.com", "type": "b", "page": "745", "user": "1232", "time": 1234567890, "tags": {"a", "b", "c"}}
    

    如果有影响,我正在使用正常的Mongo PHP扩展。

2 个答案:

答案 0 :(得分:16)

好的,我想出了一些我认为可以做你想做的事情。请注意,这可能无法正常工作,因为我不能100%确定您的架构(考虑到您的示例显示类型a中可用的refer,但不是b(我不确定这是否是遗漏,或者是什么考虑你想通过referer查看)...无论如何,这是我想出来的:

地图功能:

function() {
    var obj = {
        "types": {},
        "tags": {},
    }
    obj.types[this.type] = 1;
    if (this.tags) {
        for (var tag in this.tags) {
            obj.tags[this.tags[tag]] = 1;
        }
    }
    emit(this.refer.url, obj);
}

减少功能:

function(key, values) {
    var obj = {
        "types": {},
        "tags": {},
    }
    for (var i = 0; i < values.length; i++) {
        for (var type in values[i].types) {
            if (!type in obj.types) {
                obj.types[type] = 0;
            }
            obj.types[type] += values[i].types[type];
        }
        for (var tag in values[i].tags) {
            if (!tag in obj.tags) {
                obj.tags[tag] = 0;
            }
            obj.tags[tag] += values[i].tags[tag];
        }
    }
    return obj;
}

基本上,它是如何工作的。 Map函数使用refer.url的键(我根据您的描述猜测)。因此,最终结果看起来像_id等于refer.url的数组(它基于url分组)。然后它创建一个对象,其下有两个对象(类型和标签)。对象的原因是map和reduce可以发出相同的格式对象。除此之外,我认为它应该是相对自我解释的(如果你不明白,我可以尝试解释更多)......

因此,让我们在PHP中实现这一点(假设$map$reduce是包含上述内容的字符串,用于简洁性):

$mapFunc = new MongoCode($map);
$reduceFunc = new MongoCode($reduce);
$query = array(
    'time' => array('$gte' => time() - (60*60*60*24*30)),
    'refer.external' => true
);
$collection = 'visits';
$command = array(
    'mapreduce' => $collection,
    'map' => $mapFunc,
    'reduce' => $reduceFunc,
    'query' => $query,
);

$statsInfo = $db->command($command);

$statsCollection = $db->selectCollection($sales['result']);

$stats = $statsCollection->find();

foreach ($stats as $stat) {
    echo $stats['_id'] .' Visited ';
    foreach ($stats['value']['types'] as $type => $times) {
        echo "Type $type $times Times, ";
    }
    foreach ($stats['value']['tags'] as $tag => $times) {
        echo "Tag $tag $times Times, ";
    }
    echo "\n";
}

注意,我没有测试过这个。这正是我基于对模式的理解,以及对Mongo及其Map-Reduce实现的理解而得出的结论......

答案 1 :(得分:0)