标签: python cluster-computing cluster-analysis silhouette
我正在使用一系列n_clusters值执行分层聚类,并计算calinsky分数和轮廓分数,以确定最佳n_clusters值。但是,我正在观察两者之间的权衡,并且不知道该选择哪个,因为它们的比例不同。
起初,选择n = 105似乎很直观,但是当轮廓分数下降时,calinski分数会不断上升