数学上,offset_column
参数如何在训练期间和预测中用于H2O中的随机森林算法?
来自文档:
注意:偏移是模型训练期间使用的每行“偏差值”。对于高斯分布,可以将它们视为对响应(y)列的简单校正。模型学习预测响应列的(行)偏移,而不是学习预测响应(y行)。对于其他分布,在应用反向链接函数以获得实际响应值之前,在线性化空间中应用偏移校正。有关更多信息,请参阅以下链接。
考虑到随机森林没有相同的“线性化空间”概念,这与将响应单独应用于响应有什么不同吗?
答案 0 :(得分:2)
感谢您指出这一点! H2O的分布式随机森林实际上不支持偏移参数。这些参数将在以后的版本中删除。可以在此处找到问题的jira票证:https://0xdata.atlassian.net/browse/PUBDEV-5191