Question

我正在尝试对我拥有的pandas数据集执行k-means聚类。

数据集如下：

(ONStotal_SRS1, ONSmean_SRS1,CI_SRS_1)

索引列按小时计算为1年，总共有33列。

我想要做的是，我想在列之间执行kmeans聚类分析，其中包括每一行作为时间序列。我期待输出如下：

Cluster1：列A D G

Cluster2：B C E列

Cluster3：Col I J K

共有7个集群。

我写的代码如下：

Index        A    B    C    D    E
01-01.2000
01:00:00     1    1    1    1    2
01-01-2000
02:00:00     0    1    2    3    0.68
01-01-2000
03:00:00     0.58 2    4    0    0.72

然而，在我运行上面的代码之后，我得到了下面的图表，这不是我想要生成的输出，因为它不显示总共7个集群

我注意到＆＃39;标签＆＃39;变量，我总共有8760行和1列，我认为我的方法认为每行都是独立的，而不是将行作为时间序列逐列聚类。

无论如何通过k-means聚类我可以得到我想要的输出？或者我应该考虑其他聚类方法？

K-Means在数据集中的列之间进行聚类

0 个答案: