我看到H2O文档说我们可以在其所有所有受监督模型中使用partial_plot。
因此,我在我的DRF和GBM模型weight_column中都添加了这个“ weight_column”。
rf_model.train(x=x, y =y, training_frame=htrain, weights_column = 'wgt_col')
但是当我使用以下代码进行评估时,模型性能(尤其是在测试和交叉验证中)看起来很糟糕。 AUC从火车的0.7降到xval的0.5和测试的0.4。
rf_model.model_performance(xval = True)
rf_test_perf = rf_model.model_performance(htest)
是否有可能我没有正确使用'weights_column'来计算AUC而不考虑重量?我知道也需要添加此权重参数。我还有其他需要添加此权重参数的地方吗?还是有任何H2O文档,例如使用重量进行训练,测试和验证的示例?