上下文:我使用带有Poisson可能性(以及log / exp链接)的SVGP训练了一个模型。 除了预测计数之外,我还要采取不确定性措施。
函数m.predict_y
提供了预测均值和预测方差。在具有泊松可能性的情况下,它使用Likelihood.predict_mean_and_var
且具有高斯-赫尔姆特正交的默认实现。
这是在计算计数(即目标/因变量)的期望值还是泊松参数的期望值?
(i)如果是泊松参数的预测均值/方差,那么人们将如何利用这一方差来获得有意义的可信区间?
(ii)如果它是计数的预测均值/变量,则均值不应该与方差相同(因为我们对所有内容进行了积分,但y和y是泊松分布)?还是我误解了预测方差的概念?
如果我对代码的理解正确,我们将获得泊松参数(i)的预测均值/方差。
在我目前的方法中,我重写了predict_mean_and_var
,以便它使用mcmc方法ndiag_mc_perc
代替了Hermite-Gauss近似值,然后只返回了样本的10%/ 90%。 >
答案 0 :(得分:1)
简短答案:predict_y
预测 y 的均值和方差,该值总是在观察空间中,即,您传递给Y
所在的空间模型构造函数。在这种情况下,它是计数的均值和方差,即第二点(ii)。对于泊松分布,给定强度,均值和方差始终相同(等于强度),即以潜在GP f 的值为条件;由于{em> f 中的不确定性已被整合,对于Poisson似然模型,predict_y
返回的均值和方差之间将存在微小差异。
尽管您有多个观测,但谈论强度的不确定性才是真正有意义的,但是在GPflow中实现的泊松似然中,一个Y
构成了一个单个观察(因为每个观察通常包含许多事件)。您可以建立一个知道多个观测值的可能性,然后您会发现,如预期的那样,对于更多观测值的不确定性会降低。
(如果您的计数方差不等于计数期望,则您可能要考虑分散或未充分分散的计数可能性,例如负二项式或其他)。