我通常是一个R用户(一个开始的R用户,但我开始掌握它)。但是,我听说过关于ELKI的积极的事情 - 特别是它的速度。我遇到了这篇旧帖"How to group nearby latitude and longitude locations stored in SQL",Anony-Mousse发布的答案与我想做的相似。我希望能够复制他在Google云端硬盘上分享的KML文件所做的每一步。
我已经下载了ELKI并且能够运行迷你GUI,如下所示:
有人可以发布一些关于如何做Anony-Mousse能够做的事情的步骤吗?
我的数据非常相似。我在csv文件中对地址进行了地理编码(更具体地说,每个元组都是一个事件,其中一个变量/ features / columns是事件的地理编码地址)我正在寻找与上面链接中的OP非常相似的集群
希望Anony-Mousse能够阅读这篇文章并开始拯救。但是,如果有人能帮助我帮助我,我将不胜感激。
答案 0 :(得分:1)
很抱歉没有提前跟进。
我没有保留您参考的实验代码。所以我不记得是否使用python脚本将输出重写为KML(我相信我这样做了),或者我是否只是从ELKI源复制并粘贴到自定义ResultHandler
来生成文件。
可能是第一个,因为在Java中编写XML比在Python中打印文档要复杂得多(尽管也更可能是正确的XML)。如果是这样,我可能使用scipy.spatial
包计算凸包,读取ELKI文本输出相当简单(只需跳过注释行,并将另一个数字列作为坐标)