是否可以在python中选择HDBSCAN算法中的簇数?或者唯一的方法是使用输入参数,例如alpha,min_cluster_size?
由于
更新 这是使用fcluster和hdbscan
的代码import hdbscan
from scipy.cluster.hierarchy import fcluster
clusterer = hdbscan.HDBSCAN()
clusterer.fit(X)
Z = clusterer.single_linkage_tree_.to_numpy()
labels = fcluster(Z, 2, criterion='maxclust')
答案 0 :(得分:0)
如果您明确需要获得固定数量的群集,那么最接近管理的就是使用群集层次结构并在层次结构中执行平面切割,从而为您提供所需数量的群集。这确实涉及使用HDBSCAN暴露的一个树对象并让你的手有点脏,但它可以完成。