我尝试使用Ward" pre-clustered"进行分层/凝聚聚类。集群。由于这些输入可能不具有相同的基数,因此使用scipy的链接功能的更新距离将会偏斜。
要清楚,我有n
个输入簇,一个带有n*(n-1)/2
值的压缩距离矩阵(从pdist给出的相同),以及与每个输入簇相对应的权重。我应该使用什么包来聚集我的输入?或者有没有办法操纵我的输入以使用scipy?
(注意:我已经在R' hclust
函数中看到了这一点,您最初可以指定members
权重,想要与Python类似的东西)