时间衰减和草图

时间:2018-01-15 17:02:05

标签: algorithm data-mining sampling sketching

在学校的数据挖掘课程中,我收到了关于素描的以下问题:

  

考虑具有时间戳的事件流:t 1 &lt;吨<子> 2 &LT; ...

     

我们感兴趣   保持时间戳草图,以便我们估计当前时间衰减的时间   t为CV,ε

     

T α =Σα(t i

     

任何衰减函数α

我尝试使用Morris计数器,因为它具有对数大小,并且在衰减函数中具有最大值的第一个时间戳的采样概率更大。

但莫里斯计数器的CV是一个常数,我无法弄清楚如何修改它。

编辑: 到目前为止我的解决方案:

initialize: x = 0, result = 0
for each new timestamp t:   
- sample it with probability of 2^(-x)
- if it is sampled:
   - x++
   - result = result  + α(t)

0 个答案:

没有答案