标签: machine-learning scikit-learn cluster-analysis hierarchical-clustering
我正在尝试实施Chakrabarti算法,以便随着时间的推移进行平滑聚类。对于凝聚聚类,要合并的下一个聚类的选择取决于两个组成部分:
后者有几种变化。例如,一个包括合并距离(不仅如此):如果我们合并两个子集合 S1 和 S2 ,那么平均距离(就边缘而言)是多少所有叶子都在 S1 和 S2 。
我考虑为这些算法修改sklearn AgglomerativeClustering,我有几个问题: