图上的点的聚类或k-中值

时间:2013-11-13 07:19:58

标签: algorithm cluster-analysis median

我正在绘制我的应用程序的帧时间,我想自动计算出中位数。我认为k-medians算法正是我所追求的,但不确定我的问题是如何应用的。我的数据点是常规间隔,因此我没有任意 2D 数据,但我也没有 1D 数据作为时间维度很重要。

enter image description here

我应该如何计算这些集群(我只对2个中位数而不是k-中位数感到高兴)?数据可能非常嘈杂,这就是为什么我需要中位数而不是手段,我不希望噪声干扰聚类。

另外,是否有比维基百科K medians clustering更深入的文章?

1 个答案:

答案 0 :(得分:2)

不要使用群集。

对于多变量数据,群集分析实际上是设计的

1维数据从根本上不同,因为它是有序的。多变量数据不是。这意味着您可以为一维数据构建更多更高效的算法,而不是多变量数据。

在这里,您要执行时间序列分割。您可能希望研究诸如自然中断优化之类的方法,但也可以核密度估计。

最简单的方法是跟踪标准偏差,一旦许多点大幅偏离,就会在那里进行分割。