基于移动窗口的核密度估计

时间:2016-02-18 03:43:08

标签: machine-learning statistics probability-density

我有一个数据流,我想要估计内核密度(或直方图)。输入参数是窗口长度。例如60秒,或5分钟或一个月。任何早于窗口大小的数据都应该最小程度地影响估计。但是,我无法存储实际的数据点。一旦新数据样本到达,我想将其添加到估算器并丢弃它。由于这是资源受限的环境(CPU +存储器),因此该方法在空间和时间复杂度上应优选为O(1)。

是否有任何现成的图书馆已经完成这项工作? 我更喜欢GO中的一些东西,但我会采用任何语言的实现。

如果没有现有的实现,是否有我可以参考并实现的算法?

(在Google上搜索没有给我任何直接答案,我是机器学习和统计新手)

1 个答案:

答案 0 :(得分:1)

几何衰减的直方图可以完成这项任务。

$$ h(i)= h(i)*(1 - e ^ { - 1 / \ tau})+ e ^ { - 1 / \ tau} \ delta(i-j)$$

其中$ j $是新观察值,$ h(i)$是运行平均直方图,$ \ tau $是时间常数。