我正在使用匹配对(1到5/6匹配)的数据库工作,并尝试使用条件逻辑回归获得变量的优势比(95%置信区间)。
G1_LR<-glm(formula=MCM.POSS~factor(AED1TRIM_EXP)+factor(BMI)+factor(FOLIC_ACID),family=binomial(),data=G1)
summary(clogit((MCM.POSS)~factor(AED1TRIM_EXP)+factor(BMI)+factor(SMOKING)+factor(FOLIC_ACID)+strata(BABY_PATID),data=G1))**
此后,我发现我的两个预测变量具有准完全分离,因此我决定尝试惩罚最大似然估计方法(logistf)。
G1_edited<-logistf(formula=MCM.POSS~factor(AED1TRIM_EXP)+factor(BMI)+factor(SMOKING)+factor(FOLIC_ACID),family=binomial(),data=G1)
然而,出现了两个问题。首先,优势比(从logistf
命令(OR = 0.9
)获得的95%置信区间与clogit和glm命令(OR = 3.0)差别很大。其次,我试过但未能包括{ {1}}函数(就像我在clogit命令中所做的那样考虑我的cond.logistic回归中的匹配对)到strata()
命令,所以我怀疑获得的logistf
是不正确的,因为它确实不要将我的案例与其各自的5/6控件进行比较。
是否有对OR获得的差异的解释,是否有办法将OR = 0.9
函数包含到我的strata()
命令中?非常感谢你提前!
PS:我是R的新手,所以如果问题没有明确表达或者您需要进一步澄清,请告诉我。