计算不同的访客并非易事。例如,在网络分析中,访问者可以在周一和周四访问,但在计算该周的唯一访问者时,我希望只计算一次该访问者。
count (distinct userid)
一个月内10M次访问的速度不能太快,因为无法应用聚合(因为count distinct不是“可添加的”度量)。
我的问题是:Google Analytics和其他网络分析平台如何快速返回唯一身份访问者?我假设使用了统计估计。哪一种?怎么样?
答案 0 :(得分:0)
他们设置了一个合理到期的cookie。如果你已经有了cookie,你就会回来。
答案 1 :(得分:0)
有关可用于唯一身份计数的概率方法http://highlyscalable.wordpress.com/2012/05/01/probabilistic-structures-web-analytics-data-mining/的概述,请参阅此帖子