在学校的数据挖掘课程中,我收到了关于素描的以下问题:
考虑具有时间戳的事件流:t 1 &lt;吨<子> 2 子>&LT; ...
我们感兴趣 保持时间戳草图,以便我们估计当前时间衰减的时间 t为CV,ε
T α =Σα(t i )
任何衰减函数α
我尝试使用Morris计数器,因为它具有对数大小,并且在衰减函数中具有最大值的第一个时间戳的采样概率更大。
但莫里斯计数器的CV是一个常数,我无法弄清楚如何修改它。
编辑: 到目前为止我的解决方案:
initialize: x = 0, result = 0
for each new timestamp t:
- sample it with probability of 2^(-x)
- if it is sampled:
- x++
- result = result + α(t)