应用错误收集

我正在使用scikit-learn。假设我们有如下数据：

a = [1, 2, 3, 4, 5, 4, 3, 2, 1]
b = [2, 1, 3, 4, 6, 7, 7, 4, 2]
c = [2, 3, 4, 3, 5, 6, 6, 6, 4]

我们运行以下内容：

temp.append(a)
temp.append(b)
temp.append(c)
k_data.append(temp)

k_means = cluster.KMeans(init='k-means++', n_clusters=2, n_init=5)
k_means.fit(np.array(k_data))

我知道K-means会为每个条目分配自己的集群和标签，每个标签对应一个集群。这里的聚类中心将是9维向量。有没有办法知道每个数据输入对形成该集群/集群中心有多大影响？例如，对于cluster_1 / cluster_center_1，它使用了33％的条目，10％的b和57％的c条目。

看看K-means方法和属性，没有直接的方法。特别是K-means接受数组作为输入。

将原始数据与Kmeans群集相关联

0 个答案: