将原始数据与Kmeans群集相关联

时间:2014-08-06 21:53:21

标签: python scikit-learn k-means

我正在使用scikit-learn。假设我们有如下数据:

a = [1, 2, 3, 4, 5, 4, 3, 2, 1]
b = [2, 1, 3, 4, 6, 7, 7, 4, 2]
c = [2, 3, 4, 3, 5, 6, 6, 6, 4]

我们运行以下内容:

temp.append(a)
temp.append(b)
temp.append(c)
k_data.append(temp)

k_means = cluster.KMeans(init='k-means++', n_clusters=2, n_init=5)
k_means.fit(np.array(k_data))

我知道K-means会为每个条目分配自己的集群和标签,每个标签对应一个集群。这里的聚类中心将是9维向量。有没有办法知道每个数据输入对形成该集群/集群中心有多大影响?例如,对于cluster_1 / cluster_center_1,它使用了33%的条目,10%的b和57%的c条目。

看看K-means方法和属性,没有直接的方法。特别是K-means接受数组作为输入。

0 个答案:

没有答案