基于密度的聚类库,以距离矩阵为输入

时间:2011-09-12 08:48:40

标签: matrix cluster-analysis distance dbscan

需要帮助找到基于开放/自由密度的聚类库,该聚类库将距离矩阵作为输入并返回聚类,其中每个元素与聚类中的每个其他元素之间的距离最大“x”(基本上返回聚类指定密度)。

我检查了DBSCAN算法,它似乎符合我的需要。 DBSCAN的任何干净实现,你可能没有关闭,可以使用预先计算的距离矩阵和具有所需密度的输出集群起飞?

您的输入将非常有用。

3 个答案:

答案 0 :(得分:1)

ELKI(http://elki.dbs.ifi.lmu.de/)可以加载二进制或Ascii格式的外部距离矩阵,然后在其上运行基于距离的聚类算法。

然而,某些算法(如k-means)无法工作,因为它们依赖于/ mean /的距离,这显然不是预先计算的。但是例如DBSCAN和OPTICS在预先计算的距离下工作正常。

答案 1 :(得分:0)

我还没有尝试过,但是我正在寻找类似的东西并遇到了DBSCAN的这个python实现:

http://scikit-learn.org/dev/auto_examples/cluster/plot_dbscan.html#example-cluster-plot-dbscan-py

答案 2 :(得分:0)

Matlab file exchange has an implementation可以直接适应预先计算的矩阵。只需删除代码中函数外的pdist1调用。