所以我有一个输入向量,A是一个有3,000个数据点的行向量。使用MATLAB,我找到了3个A群集中心。
现在我有3个集群中心,我有另一行Vector B,有3000个点。 B的元素具有三个值中的一个:1,2或3.例如,如果B的前5个元素是
B(1,1:5) = [ 1 , 3, 3, 2, 1]
这意味着B(1,1)属于集群1,B(1,2)属于集群3等。我想要做的是对于行向量B中的每个数据点,我看看是什么通过读取它的值然后将其替换为来自该集群的数据值,它属于它。
所以在完成上述操作后,B的前5个元素将如下所示:
B(1,1:5)= [2.7,78.4,55.3,19,0.3]
意味着B(1,1)是从第一个集群(我们从A获得)中选取的数据值,B(1,2)是从第三个集群中获取的数据值(我们从A获得)等
答案 0 :(得分:0)
k-means仅保留均值,它不对数据分布进行建模。
如果没有额外的统计和分布假设,您无法从k均值聚类中合理地生成人工数据。