具有自定义距离度量的凝聚聚类(替代输入关联度量)

时间:2017-10-17 21:37:16

标签: python-3.x scipy scikit-learn correlation hierarchical-clustering

我正在寻找针对我们的训练变量集关于它们的相关矩阵实现层次聚类模型(它是一个100x100矩阵,我想要最大的聚类,其元素是最不相关的)。我已经能够使用scipy系列函数来实现这一点,但是,为了可视化和演示,我想为我的数据定义一个替代的相关距离。

内置距离“相关性”度量定义为1-r,其中r是两个变量之间的皮尔逊得分。我想将它改为1-absvalue(r) - 我最有趣的变量是最不相关的变量(所以说变量发现自己相距1-.8距离)。谢谢!

0 个答案:

没有答案