我知道这更像是一个机器学习问题而不是H2O,但是因为我在H2O中运行它,我想知道是否有人以前见过这个。这就是我的混淆矩阵与训练数据一样(使用GBM模型,但也发生在其他线性模型中)
N Y Error Rate
N 6921014.0 2076845.0 0.2308 (2076845.0/8997859.0)
Y 399597.0 8597833.0 0.0444 (399597.0/8997430.0)
Total 7320611.0 10674678.0000000 0.1376 (2476442.0/17995289.0)
验证:
N Y Error Rate
N 4697621.0 263504.0 0.0531 (263504.0/4961125.0)
Y 148169.0 167182.0 0.4699 (148169.0/315351.0)
Total 4845790.0 430686.0 0.078 (411673.0/5276476.0)
Y错误率大幅上升。除非我遗漏了什么,否则我没有看到任何过度拟合的属性。有没有人遇到过这个? 这似乎也适用于线性模型。