所有,我有21个行业领域的相关矩阵。现在,我想将这21个扇区分为4个或5个组,将行为相似的扇区组合在一起。
请问专家们如何在Python中做到这一点?提前谢谢!
答案 0 :(得分:3)
您可能会探索使用熊猫DataFrame.corr
和scipy.cluster
分层聚类软件包
import pandas as pd
import scipy.cluster.hierarchy as spc
df = pd.DataFrame(my_data)
corr = df.corr().values
pdist = spc.distance.pdist(corr)
linkage = spc.linkage(pdist, method='complete')
idx = spc.fcluster(linkage, 0.5 * pdist.max(), 'distance')