可以说我有一个DataFrame,其中包含整个行中的时间序列值。 我通过以下代码从scipy进行了层次聚类:
from scipy.cluster.hierarchy import dendrogram, linkage
Z = linkage(df, 'ward')
fig = plt.figure(figsize=(25, 10))
dn = dendrogram(Z)
树状图显示数据帧具有两个群集。对于时间序列值的每一行,我想创建另一列,这是分层聚类的结果,例如,聚类1或聚类2。我该怎么做?
我也使用n_clusters = 2从scikit-learn中进行了K均值聚类。
kmean=KMeans(n_clusters = 2)
kmean.fit(df)
如何检查哪些数据属于哪个集群?并在df的新列中创建它?