应用错误收集

时间：2012-01-13 14:42:10

标签： algorithm machine-learning weka

我已经记录了许多不同类型的蘑菇。这些应分为食用和有毒。分类必须与k-最近邻居（1）和J48一起执行。

两种算法都显示出99.88％的精度。与我相关的是假阳性率。 J48的比率为0.3％，KNN为0％。所以我想说KNN更适合所选择的问题。

但是，我不知道答案为什么。对于某些记录而言，为什么KNN比J48更好？

第二件事是我应该使用10倍交叉验证。那是什么意思？

提前致谢

答案 0 :(得分：1)

对于某些记录而言，为什么KNN比J48更好？

没有。它在很大程度上取决于数据集，两种算法的设置以及您进行评估的方式（您确实使用了单独的培训和测试集，不是吗？）。

10倍交叉验证意味着：您将数据集拆分为10个大小相同的“折叠”，然后对于每个折叠 i

并取平均准确度。请参阅Wikipedia或任何有关机器学习的书籍。