当我们说我们正在评估WEKA frmework中的集群时,我们的意思是什么?聚类是一种无监督的对象分组方法。当我们说要评估结果时,我们的意思是什么?此外,除此之外,当我们说我们在训练数据本身之上评估集群时,这意味着什么?
由于 Abhishek S
答案 0 :(得分:9)
正如this页面上所写:
<强>评价强> Weka评估聚类的方式取决于您选择的聚类模式。有四种不同的群集模式可用(作为群集模式面板中的按钮):
Use training set
(默认)。生成聚类之后,Weka根据聚类表示将训练实例分类为聚类,并计算落入每个聚类的实例百分比。例如,k-means生成的上述聚类在集群0中显示43%(6个实例),在集群1中显示57%(8个实例)。Supplied test set
或Percentage split
如果群集表示是概率性的(例如,对于EM),Weka可以在单独的测试数据上评估群集。Classes to clusters evaluation
。在这种模式下,Weka首先忽略class属性并生成聚类。然后在测试阶段,它根据每个集群中类属性的多数值为集群分配类。然后,它根据此分配计算分类错误,并显示相应的混淆矩阵。 k-means的一个例子如下所示。