我正在分析纵向面板数据,其中个体在马尔可夫链中的不同状态之间转换。我使用一系列多项Logistic回归建模了状态之间的转换率。这意味着我最终得到了大量的回归斜率。
对于每个回归斜率,我获得后验分布(使用WinBUGS)。从后验分布,我们得到与所讨论的斜率相关的平均值,标准偏差和95%可信区间。
我最感兴趣的价值是通过马尔可夫链预期的首次通过时间('击中时间')。这是所有不同预测变量的函数,因此是根据多项Logistic回归产生的许多回归斜率构建的。
一种简单的方法是将每个后验分布的均值作为每个回归斜率的点估计值,并求解预测变量的一系列不同值的预期第一次通过时间。我现在已经这样做了,但它可能会产生误导,因为它没有显示预期首次通过时间预测值的不确定性。
我的问题是:如何计算预期首次通过时间的可信区间?
我的第一个想法是通过模拟近似误差,通过从每个后验分布对回归斜率的各个值进行采样,获得给定这些值的预期第一通过时间,然后绘制所有这些模拟值的标准偏差。但是,我觉得(a)这会引起统计学家的尖叫,(b)它没有考虑到不同的后验分布将相互关联的事实(它是从每一个独立的样本)。
在WinBUGS中,您实际上可以获得后验分布之间的相关性。因此,如果模拟思想合适,我可以在理论上模拟包含这些相关性的回归斜率系数。
是否有更直接,更近似的方式来找到不确定性?例如,我可以使用WinBUGS找到预测变量的一组给定值的预期第一次通过时间的后验分布吗?而不是this question的答案:定义一个新节点并对其进行监控。我会想象定义一系列新节点,其中每个节点用于一组不同的实际预测值,并监视每个节点。这是否具有良好的统计意义?
对此的任何想法都会非常感激!