来自Weka的DBSCAN实施的输出不一致

时间:2015-11-09 09:31:48

标签: cluster-analysis weka data-mining dbscan

我在Weka中使用DBSCAN实现,它似乎根据我是否选择"使用训练集"给我不同的结果。或"类集群评估"作为'群集模式'。根据文档here,选择"类到集群评估"应该只更改报告的指标。

然而,对于DBSCAN,我实际上看到了不同数量的集群。这是重现问题的一种方法:

  1. 加载IRIS数据集:选择"预处理"选项卡,单击"打开文件",转到"数据"在Weka安装中的文件夹并加载" iris"数据集。
  2. 转到"群集"选项卡并选择DBSCAN。设置epsilon = 0.5和minpts = 5.
  3. 在群集模式下,选择单选按钮"使用训练集"并开始群集。查找字符串"生成的簇数" - 这个数字对我来说是3。
  4. 现在选择无线电模式为" Classes to clusters evaluation"并重新运行群集。我现在得到1个集群。
  5. 这是预期的行为吗?我错过了什么吗?

1 个答案:

答案 0 :(得分:0)

我似乎缺少的是使用“使用训练集”设置所有属性,包括 class-label 。如果我明确删除了类,则结果匹配。