在RStudio中为GLM计算和绘制95%置信区间的最佳方法

时间:2019-06-14 22:00:17

标签: r glm confidence-interval

我目前正在使用具有详细患者信息的数据库,基于个体患者的遗传信息,对疾病发作的症状年龄进行建模。为此,我使用了Poisson系列发行版,利用了RStudio的GLM功能。

但是,为我提供了两种不同的方法来计算和绘制这些GLM的95%置信区间,两者均会产生截然不同的结果。

95%CI使用“ confint”命令(置信区间为+/- 1/2年)

对于这种方法,我使用“ confint”命令导出置信区间的上限和下限,然后将这些曲线以y = exp(a + bx)的形式直接添加到绘图中:

plot(ccmtrage~caghigh, xlab="Patient Gene Length", ylab="Symptom Age of Onset (Years)", col="grey")
mtragemodel <- glm(ccmtrage~caghigh, family="poisson")
summary(mtragemodel)
curve(exp(6.53681944-(0.06349848*x)), add=TRUE, lty=1, col="red")
confint(mtragemodel)
curve(exp(6.53681944-(0.06349848*x)), add=TRUE, lty=2, col="blue")
curve(exp(6.58285539-(0.06243501*x)), add=TRUE, lty=2, col="blue")

95%CI使用线和拟合标准误差(大置信区间-+/- 5-10年)

此代码基于我上大学期间收到的有关GLM的教程。我已经联系了一位讲师,他坚持说这是正确的,但是由于结果的巨大差异,我也想在这里提问。

plot(ccmtrage~caghigh, xlab="Patient Gene Length", ylab="Symptom Age of Onset (Years)", col="grey")
mtragemodel <- glm(ccmtrage~caghigh, family="poisson")
xpred<-seq(36, 70 ,0.01)
ypred<-predict(mtragemodel,list(caghigh=xpred),type="response",se.fit=T)
lines(xpred,ypred$fit,col="red",lty=1, lwd=2)
lines(xpred,(ypred$fit+ypred$se.fit)*1.96,lty=3,col="blue", lwd=2)
lines(xpred,(ypred$fit-ypred$se.fit)/1.96,lty=3,col="blue", lwd=2)
summary(mtragemodel)

我的问题确实是:这些方法中的哪一种对于计算GLM的95%CI是正确的(或更合适的)?

如果95%CI是两个图中的最小值(请参见下文),则它有可能被临床使用(预测性测试和治疗方案的前瞻性规划)。但是,如果正确的是两个图中较大的一个,则将是有用的,但不太可能用于临床。答案可能会发生很大变化,而且治疗这种疾病的方法也会改变,因此,我们将不胜感激!

非常感谢您提供有关此问题的指导!

Distribution of Data using Density Plot Approach (GGPlot)

0 个答案:

没有答案