什么是WEKA中的集群评估?

时间:2012-06-04 09:23:23

标签: java machine-learning data-mining weka

当我们说我们正在评估WEKA frmework中的集群时,我们的意思是什么?聚类是一种无监督的对象分组方法。当我们说要评估结果时,我们的意思是什么?此外,除此之外,当我们说我们在训练数据本身之上评估集群时,这意味着什么?

由于 Abhishek S

1 个答案:

答案 0 :(得分:9)

正如this页面上所写:

<强>评价 Weka评估聚类的方式取决于您选择的聚类模式。有四种不同的群集模式可用(作为群集模式面板中的按钮):

  1. Use training set(默认)。生成聚类之后,Weka根据聚类表示将训练实例分类为聚类,并计算落入每个聚类的实例百分比。例如,k-means生成的上述聚类在集群0中显示43%(6个实例),在集群1中显示57%(8个实例)。
  2. Supplied test setPercentage split如果群集表示是概率性的(例如,对于EM),Weka可以在单独的测试数据上评估群集。
  3. Classes to clusters evaluation。在这种模式下,Weka首先忽略class属性并生成聚类。然后在测试阶段,它根据每个集群中类属性的多数值为集群分配类。然后,它根据此分配计算分类错误,并显示相应的混淆矩阵。 k-means的一个例子如下所示。