我正在尝试应用k-means算法对来自csv文件的数据进行分组。
我的代码如下所示:
kmeans=KMeans(n_clusters=6).fit(np.genfromtxt('file.csv', delimiter=' '))
kmeans.labels_
会返回此信息:
[[ 8.62068966e-03 3.44827586e-02 8.62068966e-03 ..., 9.75781955e-18
9.75781955e-18 2.15517241e-03]
[ 1.06837607e-03 1.60256410e-02 1.06837607e-03 ..., 1.06837607e-03
2.13675214e-03 1.06837607e-03]
[ -1.56125113e-17 1.14285714e-02 5.71428571e-03 ..., 1.43114687e-17
1.90476190e-03 1.90476190e-03]
[ 3.49040140e-03 1.91972077e-02 3.49040140e-03 ..., 1.71303943e-17
1.74520070e-03 1.74520070e-03]
[ 1.93050193e-02 4.63320463e-02 -2.94902991e-17 ..., 1.38777878e-17
1.38777878e-17 1.38777878e-17]
[ 3.37837838e-03 1.68918919e-02 1.01351351e-02 ..., 1.35135135e-02
3.37837838e-03 3.37837838e-03]]
我不明白为什么它会在每组中返回6个浮点数。有人可以告诉我这是什么输出?我阅读了文档,但我没有找到任何关于这个以及如何理解它的内容。
谢谢。