所以基本上我的模型基于带有装袋的ANN,每次我在测试数据上运行代码时,我总是得到不同的精度值。就像我得到33.8%(最好),28.5%,26.7%等。我很确定这是每次运行算法时在列车,测试数据之间分割数据的结果。所以我的问题是:我应该将数据分成火车,在运行前测试一次数据。然后,如果我再次运行算法,它将使用相同的列车,测试数据。
或者我不应该这样做。也就是说,我应该选择我获得的最佳准确度分数,或平均超过100次运行。
答案 0 :(得分:0)
尝试n次交叉验证。例如,将数据划分为10组。对其中的9个进行训练并对省略的进行测试。这样做10次并对结果取平均值。