我使用h2o.GLM
训练了二元分类器模型。我有大约5-10个功能。我想知道生产哪个会更快?
如果我训练了随机森林模型而不是GLM,这个答案会改变吗?
我需要获得约1亿行。我已经在分发不同的观察结果。
答案 0 :(得分:3)
对于逻辑回归,POJO或MOJO都可以。喜欢MOJO以获得更好的向后兼容性。
对于深度大于6的随机森林,绝对使用MOJO。非常大(例如1 GB的Java代码或更多)RF模型甚至无法编译。
MOJO不需要编译,这非常方便,而且对于非常深的树,它们运行得更快并且运行时间非常一致。