我用各种k值进行了K均值聚类,并得出了每个k值的惯性(惯性是所有集群的标准差之和)。
ks = range(1,30)
inertias = []
for k in ks:
km = KMeans(n_clusters=k).fit(trialsX)
inertias.append(km.inertia_)
plt.plot(ks,inertias)
根据我的阅读,最佳k值位于该图的“弯头”处,但是弯头的计算已被证明是难以捉摸的。您如何以编程方式使用此数据来计算k?