从kmean的集群生成数据

时间:2014-04-08 18:21:56

标签: matlab cluster-analysis k-means

所以我有一个输入向量,A是一个有3,000个数据点的行向量。使用MATLAB,我找到了3个A群集中心。

现在我有3个集群中心,我有另一行Vector B,有3000个点。 B的元素具有三个值中的一个:1,2或3.例如,如果B的前5个元素是

B(1,1:5) = [ 1 , 3, 3, 2, 1]

这意味着B(1,1)属于集群1,B(1,2)属于集群3等。我想要做的是对于行向量B中的每个数据点,我看看是什么通过读取它的值然后将其替换为来自该集群的数据值,它属于它。

所以在完成上述操作后,B的前5个元素将如下所示:

B(1,1:5)= [2.7,78.4,55.3,19,0.3]

意味着B(1,1)是从第一个集群(我们从A获得)中选取的数据值,B(1,2)是从第三个集群中获取的数据值(我们从A获得)等

1 个答案:

答案 0 :(得分:0)

k-means仅保留均值,它不对数据分布进行建模。

如果没有额外的统计和分布假设,您无法从k均值聚类中合理地生成人工数据。