基于值对数据进行分组的算法

时间:2015-08-21 01:43:27

标签: statistics cluster-analysis correlation data-analysis

我有一系列看起来像这样的情节:

enter image description here

原始数据如下:

dataPoint_1, dataPoint_2,dataPoint_3,...
23, 22, 56, ...
14, 13, 68, ...

在上图中,一些数据点的值彼此接近(红色,粉红色,黑色......),有些数据点远离其他数据点(绿色,蓝色......)并且数据不断出现,因此线条正在变得越来越长是否有一种算法可以帮助我找到哪些数据点(图中的线条)是近的,哪些不是?不确定某些统计算法是否适合这个问题?

1 个答案:

答案 0 :(得分:1)

尝试欧几里德。显然,这些系列之间的差异很大。

您也可以尝试DTW(动态时间扭曲),但我不确定它在这里增加了多少。