我们在具有4个特征的数据集上完成了k = 3个聚类的KMeans聚类,并绘制了具有输入特征的每个聚类的质心坐标。我们希望专注于集群,并尝试找出相对于其他功能,哪个功能对特定集群的贡献更大。我们对其他集群也是如此。
例如假设我们有具有特征c1
c2
c3
和f1
的群集f2
f3
f4
。簇的质心例如是
C1
C2
C3
分别具有相应的功能f1
f2
f3
f4
f1 f2 f3 f4
C1 -2.02746249 2.10961828 -0.57917217 1.687631
C2 0.63967987 -0.55768793 0.76387423 0.265274
C3 -0.38727624 0.18714381 -1.27291271 -1.273105
我们可以推断出簇1的质量,因为f2
(特征2)的质心最高,是否可以将其视为该特定簇的最重要/最重要的特征,类似{{1 }}(功能3)最高,因此可以将其视为集群2的重要功能。