我正在尝试使用R tree实现DBSCAN。我们可以以R树的形式存储数据。所以我的问题是如何在R树中存储实时数据以及如何实现区域查询以查找邻域用它点?
答案 0 :(得分:2)
首先实施R-Trees,然后实施DBSCAN。
至于实时,您可能希望研究数据流的专用聚类算法。
答案 1 :(得分:0)
我不确定你的实时数据是什么意思。如果您参考更改数据或流数据,您也可以删除R树中过时的内容。如果你的意思是你的数据也有一个时间维度,你可以简单地将R树所管理的系数数量扩展到(x,y,t) - 我假设你使用的是简单的双变量版本。
如果要实施DBSCAN,则需要执行范围查询以计算点周围球形区域的密度。因此,您的区域查询应该能够处理球形查询区域(为此我还建议您查看Shinichi Satoh的SR-Tree,可能会有所帮助)。同样,如果通过实时数据表示您的数据具有时间特征,您可能需要考虑使用椭圆体的查询区域(允许单独缩放空间和时间特征)。
希望有所帮助:]