我想对条件逻辑回归模型进行模拟研究。我的模型如下:
log(p /(1-p))= b_1 *性别+ b_2 *曝光(1)
我把它放在R:
中library(survival)
model_clogit <- clogit(case ~ sex + exposure + strata(set), data = data)
在等式(1)中返回我想使用正确的部分,计算日志(赔率)并基于日志(赔率)计算作为案例的概率,因为它属于第i层。所以我基本上做的是反逻辑奇数得到概率=概率我把这个概率除以每个层的和(概率)。
现在,由于我的每个阶层只需要包含一个1,因此我根据概率/(总和(概率))对每个阶层采样1个权重。我执行了几次这个程序,我通过clogit和真实的计算性别和暴露系数的分布。虽然我得到了一个公平的曝光估计,但性别似乎远非如此。
有谁知道为什么?是否有更有效的方法来模拟条件逻辑回归模型中的数据?
谢谢, 阿基斯