分类中的高相对绝对误差和根相对平方误差

时间:2016-04-26 22:14:02

标签: classification weka

我的模型有一个小问题 JRip classifier

输出似乎足够好,但我担心高相对绝对误差和Root相对平方误差。当我尝试使用J48和NaiveBayes时,它的亮度也高达98%。它在分类中不是那么重要,我可以这样离开吗?否则,我该如何改进呢? 成本矩阵是:

0 1

2 0

改善了第二类TP费率的结果。 提前感谢您的帮助

1 个答案:

答案 0 :(得分:0)

相对绝对误差(和类似的Root相对平方误差)计算为平均绝对误差除以ZeroR classifier的误差(分类器,忽略所有预测变量并简单地选择最常见的值 - <在您的情况下强> a )。您可以查看公式here

如果您查看混淆矩阵,则会看到您有719 a cases303 b cases。 ZeroR分类器将所有案例分类为 a ,正确<70>正确的训练数据集。为了进行比较,您的模型正确地获得了66%(!)。

相对绝对误差的值在你的情况下(分类)不是很重要,因为这样的误差值并不重要(你要找 1或2 ,如果预测不关心只要选择正确的类,模型计算1.88或1.77 。但是,如上所述,您的模型得分不是很高,超过100%的值就是它的假设。

至于模型改进,如果不了解更多信息,很难说。但你可以尝试不同的算法,例如KNN。可以找到一个例子的好解释on the IBM developerworks Blog