我正在使用ELKI-Library并使用DBSCAN实现了集群,但由于我正在使用的数据集随着时间的推移而增长,我想使用增量Clusting-Algorithm。我找到了关于增量DBSCAN算法的paper。该论文称该算法是用ELKI实现的,并且该实现是对ELKI的贡献。 但不幸的是,我无法弄清楚如何逐步使用DBSCAN。
答案 0 :(得分:0)
我认为我们还没有收到对ELKI的贡献。
尝试与作者联系。我们非常感谢这样的贡献。
只要您只有插入而不是删除,就可以修改ELKI中的GriDBSCAN和ParallelDBSCAN实现以执行增量DBSCAN群集。
然而,构建一个不错的增量DBSCAN API要困难得多:何时以及如何应对"结果"报道?常规DBSCAN有明确定义的结果,但增量DBSCAN?数据如何存储在中间?
如果您的数据集不断增长,您可能还需要更改参数。例如,减少epsilon或增加minpts。根据您的更新速率,重新运行DBSCAN可能同样有效。