如何使用具有球形度量的sklearn的DBSCAN?

时间:2014-11-16 09:45:31

标签: python scikit-learn dbscan metric

我有一组分布在球体上的数据,我试图了解必须给scikit-learn分发的DBSCAN函数指标。它不能是欧几里德度量,因为点分布的度量不是欧几里德。在sklearn数据包中是否存在针对此类情况实施的度量标准,或者将小数据集中的数据划分为最简单(如果冗长乏味)的方式?

P.S。我是python的菜鸟

P.P.S。如果我“预先计算”指标,我必须以什么形式提交预先计算的数据? 像这样?

0 - event1 - event2 - ...

event1 - 0 - 距离(event1,event2) - ...

event2 - 距离(event1,event2) - 0

请帮帮忙?

1 个答案:

答案 0 :(得分:0)

您是否尝试过metric="precomputed"

然后将距离矩阵传递给数据的DBSCAN.fit函数而不是

来自文档:

  

X数组[n_samples,n_samples]或[n_samples,n_features]:

     

样本或要素数组之间的距离数组。除非度量标准为“预先计算”,否则该数组将被视为要素数组。