scikit中最近的核心样本DBSCAN

时间:2015-12-27 11:35:20

标签: scikit-learn dbscan

我想为每个数据点找到最接近的核心样本。这样我只能用核心示例(减少数据集)来表示我的数据

Scikit似乎只提供了所有核心样本的数组。将我的数据点与此数组进行比较的强力方法是加权。 所以我想得到一个集群的核心样本,得到一个数据点的簇号,然后得到最接近的核心样本。

1 个答案:

答案 0 :(得分:1)

我不认为DBSCAN应该以这种方式使用(数据缩减)。

但特别是,DBSCAN 计算最近的核心点。所以它没有你要找的信息!

你必须自己做。

  1. 将所有核心点放入kdtree / balltree
  2. 使用索引
  3. 查找最近的邻居

    Scikit-learn提供了您已经需要的一切,它应该只是几行。