我在将数据正确地导入ELKI以运行光学算法时遇到了一些麻烦,但是使用光学的R实现,我可以轻松获得可达性距离列表。我可以把它们写成这样的文件。 (指数,距离)
1 Inf
2 0.5
3 0.9 ...
我想找到由本地最小值分隔的集群。我认为ELKI软件中的Optics Xi算法可以做到这一点,但由于我在导入数据时遇到问题,我无法使用它。
使用Optics论文中的伪代码以另一种语言编写Optics集群提取算法会更容易吗?我认为从最基本的角度来看,当它们彼此相邻时,只是将指数聚集在一起,并且没有减少到新的局部最小值。
由于
答案 0 :(得分:2)
您可以尝试实现接口OPTICSTypeAlgorithm
,这主要意味着读取数据并将其存储在ClusterOrder
类型的对象中。
然而,ELKI包含一个略高级的OPTICS版本,可以用OPTICSXi产生更好的效果。详细信息最终将作为技术报告发布。您从R实现获得的数据不足以纠正OPTICS图中的一些常见工件。
请使用ELKI中的OPTICS版本。尝试覆盖树索引(这是非常快速和易于使用)。避免在输入数据中使用ID列,或告诉解析器哪一列是ID列。