使用ELKI源代码进行分层聚类

时间:2015-08-09 15:44:44

标签: java hierarchical-clustering elki

我尝试使用ELKI(用于开发索引结构支持的KDD应用程序的环境)进行分层聚类。所以几天前,我导入了ELKI源代码(Maven项目),然后运行了miniGUI。

我的问题是:

  1. 我想将ResultVisulizer用于结果。但是,我发现resulthandler中没有ResultVisulizer项。如何在此处列出此ResultVisulizer项目?

  2. 我想看看层次聚类的树形图。为此目的,需要在此miniGUI中设置哪些参数?

1 个答案:

答案 0 :(得分:0)

  1. 要启用SVG可视化工具,请启用svg maven 配置文件。 SVG增加了大约17 MB的依赖项,因此我们决定将其作为可选模块。

  2. ELKI目前没有树形图可视化,因为这种可视化不是很容易扩展;有超过几十个实例,他们变得难以阅读。此外,在许多有趣的数据集上,距离(高度)太相似,所以不幸的是,树状图再次不是很有用。

    如果提取群集并简化层次结构,ELKI将显示群集层次结构树,但不会使用高度信息(出于上述原因,并且出于可读性原因)。 ELKI具有强大的分层聚类的聚类提取方法,这些方法在R中是不可用的。

    欢迎您提供树状图可视化;但请尽量使其对广泛的用户群有用,而无需过多的自定义。

  3. 以下是R (Source)的一个例子,说明为什么我不相信树状图(以及为什么它在我的个人优先列表中很低 - 其他人必须将此贡献给ELKI): Dendrogram fail