Python:开始使用群集

时间:2019-01-28 06:35:14

标签: python scipy cluster-analysis

我试图了解python的层次结构集群模块中的此链接功能的作用(无法从文档或其他更复杂的问题中了解)。

我尝试了一个带有随机向量的示例。我不知道从哪里开始计算这是什么,为什么链接中有12个数字,它们是什么?

谢谢

dist_vec=np.random.randint(1,10,6)
print dist_vec
[4 2 2 6 5 1]

# create linkage
Z = linkage(dist_vec, method='single')

# distance = 0.8 as cutoff
clusters = fcluster(Z, 0.8, criterion='distance')

print Z
[[ 2.  3.  1.  2.]
[ 0.  4.  2.  3.]
[ 1.  5.  4.  4.]]

1 个答案:

答案 0 :(得分:0)

输出格式在scipy文档中进行了说明。

这是两个集群ID,高度和点数。

我强烈建议从2d欧式玩具数据开始。不是随机距离矩阵(这将是不一致的)。