训练与交叉验证错误

时间:2017-12-07 20:25:19

标签: python machine-learning h2o

我知道这更像是一个机器学习问题而不是H2O,但是因为我在H2O中运行它,我想知道是否有人以前见过这个。这就是我的混淆矩阵与训练数据一样(使用GBM模型,但也发生在其他线性模型中)

        N       Y       Error   Rate
N       6921014.0       2076845.0       0.2308  (2076845.0/8997859.0)
Y       399597.0        8597833.0       0.0444  (399597.0/8997430.0)
Total   7320611.0       10674678.0000000        0.1376  (2476442.0/17995289.0)

验证:

N   Y   Error   Rate
N   4697621.0   263504.0    0.0531  (263504.0/4961125.0)
Y   148169.0    167182.0    0.4699  (148169.0/315351.0)
Total   4845790.0   430686.0    0.078   (411673.0/5276476.0)

Y错误率大幅上升。除非我遗漏了什么,否则我没有看到任何过度拟合的属性。有没有人遇到过这个? 这似乎也适用于线性模型。

0 个答案:

没有答案