使用聚类确定数据同质性/异质性

时间:2018-09-15 18:07:09

标签: cluster-analysis k-means

我有一个顺序数据(即每次出现一个实例)。我想确定(一段时间后)累积的实例数量是随机的(即稀疏的)还是同类的(即存在一定的相关性)。

为此,我使用了顺序K均值。首先,给出两个聚类中心,然后将数据依次聚类为两个类。过了一会儿,如果我观察到两个群集之间的数据稀疏,那么我说这是随机的。但是,如果我观察到数据大部分都聚集在一个群集中(例如,数据的70%),那么我说数据是同质的。

我的想法正确吗?

0 个答案:

没有答案