我正在尝试对我拥有的pandas数据集执行k-means聚类。
数据集如下:
(ONStotal_SRS1, ONSmean_SRS1,CI_SRS_1)
索引列按小时计算为1年,总共有33列。
我想要做的是,我想在列之间执行kmeans聚类分析,其中包括每一行作为时间序列。我期待输出如下:
Cluster1:列A D G
Cluster2:B C E列
Cluster3:Col I J K
共有7个集群。
我写的代码如下:
Index A B C D E
01-01.2000
01:00:00 1 1 1 1 2
01-01-2000
02:00:00 0 1 2 3 0.68
01-01-2000
03:00:00 0.58 2 4 0 0.72
然而,在我运行上面的代码之后,我得到了下面的图表,这不是我想要生成的输出,因为它不显示总共7个集群
我注意到'标签'变量,我总共有8760行和1列,我认为我的方法认为每行都是独立的,而不是将行作为时间序列逐列聚类。
无论如何通过k-means聚类我可以得到我想要的输出?或者我应该考虑其他聚类方法?