我已经记录了许多不同类型的蘑菇。这些应分为食用和有毒。分类必须与k-最近邻居(1)和J48一起执行。
两种算法都显示出99.88%的精度。与我相关的是假阳性率。 J48的比率为0.3%,KNN为0%。所以我想说KNN更适合所选择的问题。
但是,我不知道答案为什么。对于某些记录而言,为什么KNN比J48更好?
第二件事是我应该使用10倍交叉验证。那是什么意思?
提前致谢
答案 0 :(得分:1)
对于某些记录而言,为什么KNN比J48更好?
没有。它在很大程度上取决于数据集,两种算法的设置以及您进行评估的方式(您确实使用了单独的培训和测试集,不是吗?)。
10倍交叉验证意味着:您将数据集拆分为10个大小相同的“折叠”,然后对于每个折叠 i
并取平均准确度。请参阅Wikipedia或任何有关机器学习的书籍。