h2o pojo在测试数据上包含比训练模型多的列,有时会丢失训练数据集中的列

时间:2018-11-07 20:40:38

标签: deployment pojo h2o

我已经创建了我的模型POJO,在使用Hive UDF生成预测时,必须使用相同的数据类型使列保持相同的顺序吗?忽略多余的列并添加列在火车数据集中但不在测试数据集中的最干净的方法是什么,我的所有列都是double或long。

1 个答案:

答案 0 :(得分:1)

如果使用Easy包装器,它将自动为您完成此操作。

如果您不使用Easy包装器,则需要发明相同的行为。

使用Easy包装器,新列将被忽略,缺少的列将被视为N / A。