我应该在测试集和训练集中获得相同的准确性吗

时间:2020-03-22 05:12:21

标签: machine-learning

我是机器学习的新手,我建立了一个模型来预测客户是否会在下个月订阅。我在训练组上获得73.4,在测试组上获得72.8。可以吗还是我有过拟合的地方?

2 个答案:

答案 0 :(得分:0)

没关系。 当训练集中的精度较高而测试集中的精度较低时(发生边际差异)会发生过度拟合。

这就是过度拟合的样子。

Train accuracy: 99.4%
Test accuracy: 71.4%

但是,您可以使用不同的模型和特征工程来提高准确性

答案 1 :(得分:0)

我们称其为过拟合,如果训练数据的准确性异常高(大于95%)而测试数据的准确性非常低(小于65%) 。 就您而言,培训和测试的准确性几乎相似。因此,不会出现过度拟合。 尝试获取更多测试数据并检查准确性是否在降低。您还可以尝试通过

改进模型
  1. 尝试不同的算法
  2. 增加火车数据的大小
  3. 尝试进行K折交叉验证
  4. 超级参数调整
  5. 使用正则化方法
  6. 标准化功能变量