Question

我正在尝试应用k-means算法对来自csv文件的数据进行分组。

我的代码如下所示：

kmeans=KMeans(n_clusters=6).fit(np.genfromtxt('file.csv', delimiter=' '))

kmeans.labels_会返回此信息：

[[  8.62068966e-03   3.44827586e-02   8.62068966e-03 ...,   9.75781955e-18
    9.75781955e-18   2.15517241e-03]
 [  1.06837607e-03   1.60256410e-02   1.06837607e-03 ...,   1.06837607e-03
    2.13675214e-03   1.06837607e-03]
 [ -1.56125113e-17   1.14285714e-02   5.71428571e-03 ...,   1.43114687e-17
    1.90476190e-03   1.90476190e-03]
 [  3.49040140e-03   1.91972077e-02   3.49040140e-03 ...,   1.71303943e-17
    1.74520070e-03   1.74520070e-03]
 [  1.93050193e-02   4.63320463e-02  -2.94902991e-17 ...,   1.38777878e-17
    1.38777878e-17   1.38777878e-17]
 [  3.37837838e-03   1.68918919e-02   1.01351351e-02 ...,   1.35135135e-02
    3.37837838e-03   3.37837838e-03]]

我不明白为什么它会在每组中返回6个浮点数。有人可以告诉我这是什么输出？我阅读了文档，但我没有找到任何关于这个以及如何理解它的内容。

谢谢。

正确实施k均值？

0 个答案: