weka为每个数据集提供100%正确分类的实例

时间:2016-12-04 00:07:43

标签: machine-learning classification weka

我无法获得准确性,因为我提供的每个数据集都为我应用的每个分类器算法提供了100%的准确性。我的数据集是10人。 它为朴素贝叶斯,J48,JRip分类器算法提供了相同的精度。

enter image description here

+----+-------+----+----+----+----+----+-----+----+------+-------+-------+-------+
| id | name  | q1 | q2 | q3 | m1 | m2 | tut | fl | proj | fexam | total | grade |
+----+-------+----+----+----+----+----+-----+----+------+-------+-------+-------+
|  1 | abv   |  5 |  5 |  5 | 13 | 13 |   4 |  8 |    7 |    40 |   100 | p     |
|  2 | ca    |  1 |  1 |  1 |  1 |  1 |   1 |  1 |    1 |    40 |    48 | f     |
|  3 | ga    |  4 |  2 |  3 |  5 | 10 |   4 |  5 |    6 |    20 |    59 | f     |
|  4 | ui    |  5 |  4 |  4 | 12 | 13 |   3 |  7 |    7 |    39 |    94 | p     |
|  5 | pa    |  4 |  1 |  1 |  4 |  3 |   2 |  4 |    5 |    22 |    46 | f     |
|  6 | la    |  2 |  3 |  1 |  1 |  2 |   0 |  4 |    2 |    11 |    26 | f     |
|  7 | ka    |  5 |  4 |  1 |  3 |  3 |   1 |  6 |    4 |    24 |    51 | f     |
|  8 | ma    |  5 |  3 |  3 |  9 |  8 |   4 |  8 |    0 |    20 |    60 | p     |
|  9 | ash   |  2 |  5 |  5 | 11 | 12 |   3 |  7 |    6 |    30 |    81 | p     |
| 10 | opo   |  4 |  2 |  1 | 13 |  1 |   3 |  7 |    3 |    35 |    69 | p     |
+----+-------+----+----+----+----+----+-----+----+------+-------+-------+-------+

2 个答案:

答案 0 :(得分:0)

您可以从显示的输出中看到J48生成的树仅使用变量fl,因此我认为您没有@ Anony-Mousse所提到的问题。

我注意到您正在测试训练集(请参阅GUI左上角的“测试选项”单选按钮)。这几乎总是高估了准确性。你所看到的是过度拟合。相反,使用交叉验证可以更好地估计新数据的准确性。只有10个数据点,您应该使用10倍或5倍。

答案 1 :(得分:0)

尝试在“k splits”或Percentage split上进行交叉验证时测试模型。

通常在百分比分割中:训练集是数据集的2/3,测试集是1/3。

此外,我觉得你的数据集非常小......在这种情况下,有很高的准确率。