K-Means在数据集中的列之间进行聚类

时间:2018-05-02 14:28:04

标签: python scikit-learn cluster-analysis k-means

我正在尝试对我拥有的pandas数据集执行k-means聚类。

数据集如下:

(ONStotal_SRS1, ONSmean_SRS1,CI_SRS_1)

索引列按小时计算为1年,总共有33列。

我想要做的是,我想在列之间执行kmeans聚类分析,其中包括每一行作为时间序列。我期待输出如下:

Cluster1:列A D G

Cluster2:B C E列

Cluster3:Col I J K

共有7个集群。

我写的代码如下:

Index        A    B    C    D    E
01-01.2000
01:00:00     1    1    1    1    2
01-01-2000
02:00:00     0    1    2    3    0.68
01-01-2000
03:00:00     0.58 2    4    0    0.72

然而,在我运行上面的代码之后,我得到了下面的图表,这不是我想要生成的输出,因为它不显示总共7个集群

Output

我注意到'标签'变量,我总共有8760行和1列,我认为我的方法认为每行都是独立的,而不是将行作为时间序列逐列聚类。

无论如何通过k-means聚类我可以得到我想要的输出?或者我应该考虑其他聚类方法?

0 个答案:

没有答案