我正在使用scikit-learn。假设我们有如下数据:
a = [1, 2, 3, 4, 5, 4, 3, 2, 1]
b = [2, 1, 3, 4, 6, 7, 7, 4, 2]
c = [2, 3, 4, 3, 5, 6, 6, 6, 4]
我们运行以下内容:
temp.append(a)
temp.append(b)
temp.append(c)
k_data.append(temp)
k_means = cluster.KMeans(init='k-means++', n_clusters=2, n_init=5)
k_means.fit(np.array(k_data))
我知道K-means会为每个条目分配自己的集群和标签,每个标签对应一个集群。这里的聚类中心将是9维向量。有没有办法知道每个数据输入对形成该集群/集群中心有多大影响?例如,对于cluster_1 / cluster_center_1,它使用了33%的条目,10%的b和57%的c条目。
看看K-means方法和属性,没有直接的方法。特别是K-means接受数组作为输入。