应用错误收集

上下文：我使用带有Poisson可能性（以及log / exp链接）的SVGP训练了一个模型。除了预测计数之外，我还要采取不确定性措施。

函数m.predict_y提供了预测均值和预测方差。在具有泊松可能性的情况下，它使用Likelihood.predict_mean_and_var且具有高斯-赫尔姆特正交的默认实现。

这是在计算计数（即目标/因变量）的期望值还是泊松参数的期望值？

（i）如果是泊松参数的预测均值/方差，那么人们将如何利用这一方差来获得有意义的可信区间？
（ii）如果它是计数的预测均值/变量，则均值不应该与方差相同（因为我们对所有内容进行了积分，但y和y是泊松分布）？还是我误解了预测方差的概念？

如果我对代码的理解正确，我们将获得泊松参数（i）的预测均值/方差。

在我目前的方法中，我重写了predict_mean_and_var，以便它使用mcmc方法ndiag_mc_perc代替了Hermite-Gauss近似值，然后只返回了样本的10％/ 90％。 >

简短答案：predict_y预测 y 的均值和方差，该值总是在观察空间中，即，您传递给Y所在的空间模型构造函数。在这种情况下，它是计数的均值和方差，即第二点（ii）。对于泊松分布，给定强度，均值和方差始终相同（等于强度），即以潜在GP f 的值为条件；由于{em> f 中的不确定性已被整合，对于Poisson似然模型，predict_y返回的均值和方差之间将存在微小差异。

尽管您有多个观测，但谈论强度的不确定性才是真正有意义的，但是在GPflow中实现的泊松似然中，一个Y构成了一个单个观察（因为每个观察通常包含许多事件）。您可以建立一个知道多个观测值的可能性，然后您会发现，如预期的那样，对于更多观测值的不确定性会降低。

（如果您的计数方差不等于计数期望，则您可能要考虑分散或未充分分散的计数可能性，例如负二项式或其他）。

泊松可能性的GPflow预测均值/方差

1 个答案: