我正在使用Weka对一组带标签的网页进行分类,并使用AUC测量分类器性能。我有一个单独的六级因子,不用于分类,我想知道分类器在每个级别的因子上的表现如何。
我应该使用哪些技巧或措施来测试数据子集的分类器性能?
答案 0 :(得分:2)
我不确定这是否正是您的要求,但人们经常使用cross-validation将一组数据分成多个培训/测试子集,以更好地评估学习成绩。
基本思路(例如10倍交叉验证)是:
分类器的整体性能是其在所有10个测试集上的平均性能。
我环顾四周,发现some examples of how to perform cross-validation programmatically或via the Weka UI。
答案 1 :(得分:0)
Nate Kohl recommended的步骤都是正确的。另一个非常重要的问题是测量性能的功能。根据我的经验,最大化AUC有时会导致分类器的实质性偏差。我更喜欢将Matthews Correlation Coeficient (MCC)用于二进制分类器,或者Cohen's kappa用于具有两个以上可能值的分类分类器