我无法获得准确性,因为我提供的每个数据集都为我应用的每个分类器算法提供了100%的准确性。我的数据集是10人。 它为朴素贝叶斯,J48,JRip分类器算法提供了相同的精度。
+----+-------+----+----+----+----+----+-----+----+------+-------+-------+-------+
| id | name | q1 | q2 | q3 | m1 | m2 | tut | fl | proj | fexam | total | grade |
+----+-------+----+----+----+----+----+-----+----+------+-------+-------+-------+
| 1 | abv | 5 | 5 | 5 | 13 | 13 | 4 | 8 | 7 | 40 | 100 | p |
| 2 | ca | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 40 | 48 | f |
| 3 | ga | 4 | 2 | 3 | 5 | 10 | 4 | 5 | 6 | 20 | 59 | f |
| 4 | ui | 5 | 4 | 4 | 12 | 13 | 3 | 7 | 7 | 39 | 94 | p |
| 5 | pa | 4 | 1 | 1 | 4 | 3 | 2 | 4 | 5 | 22 | 46 | f |
| 6 | la | 2 | 3 | 1 | 1 | 2 | 0 | 4 | 2 | 11 | 26 | f |
| 7 | ka | 5 | 4 | 1 | 3 | 3 | 1 | 6 | 4 | 24 | 51 | f |
| 8 | ma | 5 | 3 | 3 | 9 | 8 | 4 | 8 | 0 | 20 | 60 | p |
| 9 | ash | 2 | 5 | 5 | 11 | 12 | 3 | 7 | 6 | 30 | 81 | p |
| 10 | opo | 4 | 2 | 1 | 13 | 1 | 3 | 7 | 3 | 35 | 69 | p |
+----+-------+----+----+----+----+----+-----+----+------+-------+-------+-------+
答案 0 :(得分:0)
您可以从显示的输出中看到J48生成的树仅使用变量fl,因此我认为您没有@ Anony-Mousse所提到的问题。
我注意到您正在测试训练集(请参阅GUI左上角的“测试选项”单选按钮)。这几乎总是高估了准确性。你所看到的是过度拟合。相反,使用交叉验证可以更好地估计新数据的准确性。只有10个数据点,您应该使用10倍或5倍。
答案 1 :(得分:0)
尝试在“k splits”或Percentage split上进行交叉验证时测试模型。
通常在百分比分割中:训练集是数据集的2/3,测试集是1/3。
此外,我觉得你的数据集非常小......在这种情况下,有很高的准确率。