我想为每个数据点找到最接近的核心样本。这样我只能用核心示例(减少数据集)来表示我的数据
Scikit似乎只提供了所有核心样本的数组。将我的数据点与此数组进行比较的强力方法是加权。 所以我想得到一个集群的核心样本,得到一个数据点的簇号,然后得到最接近的核心样本。
答案 0 :(得分:1)
我不认为DBSCAN应该以这种方式使用(数据缩减)。
但特别是,DBSCAN 不计算最近的核心点。所以它没有你要找的信息!
你必须自己做。
Scikit-learn提供了您已经需要的一切,它应该只是几行。