我正在尝试找出在H2O中用于Tweedie分布的平均残差偏差损失函数的确切公式。
或者,一般来说,Tweedie分布因变量的平均残余偏差是多少?
到目前为止,我已经找到了该页面(http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/glm.html#tweedie-models),其中tweedie分布的偏差公式为:
但是,在H2O代码内部(位于第103页第{https://github.com/h2oai/h2o-3/blob/master/h2o-core/src/main/java/hex/Distribution.java#L103页的github上),公式的指定方式有所不同(忽略了Ω,它只是权重,并且缺少求和):>
2 * w * (Math.pow(y, 2 - tweediePower) / ((1 - tweediePower) * (2 - tweediePower)) - y * exp(f * (1 - tweediePower)) / (1 - tweediePower) + exp(f * (2 - tweediePower)) / (2 - tweediePower))
方程式为:
那么,文档是错误的还是实现?我将不胜感激!
谢谢!
答案 0 :(得分:1)
感谢您指出这一点,尽管位于here的后端方程是正确的(因此实现是正确的),但文档中的方程似乎不正确。我创建了这个Jira ticket来更新文档中的等式。凭单包含正确的方程式以及相关的推论信息。