我在Stata 12中有一个数据集,它由三列(或多或少)组成:
因此,数据集的一部分可能如下所示:
date outcome freq
2016-03-04 0 9
2016-03-04 1 3
2016-03-05 0 11
2016-03-05 1 2
etc.
大多数日子都有测量值(虽然我故意删除了周末发生的稀疏数据)。
似乎有一个很好的季节变化,所以我使用sin(2 * pi * date / 365)和cos(2 * pi * date / 365)来计算sin和cos变量,并且我'运行逻辑回归模型,包括时间变量作为连续变量:
logit outcome c.date c.sin c.cos [fw=freq]
在逻辑回归之后,我可以使用以下方法计算正结果的概率,线性预测(即对数赔率)和线性预测的概率:
predict phat
predict lohat, xb
predict se, stdp
使用Python和Pandas,我已经计算了每天结果的几率和概率。当我将这些值与使用逻辑回归模型创建的预测点估计值进行绘制时,它看起来非常好。但是,我希望能够计算出日期条件的线性预测的预测区间。我可以很容易地计算出线性预测的置信区间(例如available options),我认为计算预测区间是直截了当的,但我找不到在Stata中做到这一点的方法。 / p>
缺乏必要的输出是否表明它不可能?
如果可能,在Stata中进行逻辑回归后估计上下预测区间的最佳方法是什么?