我正在对数据集执行均值移位聚类。 estimate_bandwidth函数估计适当的带宽以执行均值漂移聚类。
语法:
sklearn.cluster.estimate_bandwidth(X, quantile=0.3, n_samples=None, random_state=0)
我发现估计带宽随着分位数的增加而增加,导致群集数量减少。类似地,分位数的减少会降低带宽,从而降低数量。集群。
所以,似乎没有。簇的数量取决于所选择的分位数值。
如何选择最佳分位数?
答案 0 :(得分:0)
在KNN中使用分位数(在estimate_bandwidth函数内部使用)来确定带宽。
具体来说: