我正在尝试对不同处理下的树苗进行Kaplan-Meier生存分析。在12个月的实验过程中,对这些幼苗进行了9次死亡的审查。
我已成功获得生存包中使用survfit()的每种治疗和时间的KM生存估计值。但是,我不确定如何计算这些生存估计值;使用Crawley's R Book中描述的Kaplan-Meier幸存者函数(如下图所示),我手工完成了分析,发现我没有得到相同的估计值。
这些是我使用上面的等式得到的生存估计。 (这只是我实验的一种处理方法)。
当我使用函数survfit()时,这些是它返回的估计值:
summary(FMACHN.fit)
Call: survfit(formula = FMACHN ~ 1)
time n.risk n.event survival std.err lower 95% CI upper 95% CI
4 54 3 0.944 0.0312 0.885 1.000
5 45 4 0.860 0.0491 0.769 0.962
6 36 4 0.765 0.0627 0.651 0.898
7 27 4 0.652 0.0748 0.520 0.816
8 18 4 0.507 0.0864 0.363 0.708
9 9 5 0.225 0.0923 0.101 0.503
我能想到的唯一可能是问题的是我导入到函数中的数据格式。我已经完成了几个KM分析的例子,我相信我已经按照这些例子正确地构建了我的数据,所以这里是我的部分数据。 “ID”只是该治疗中个体的计数,“时间”是实验中的时间点(在这种情况下,它上升到9),“死亡”表示在该时间段内死亡的幼苗数量。这只是我展示的第一个表格的较长形式。
我的分析代码如下:
library(survival)
#note that the object name "all" is what I called the dataset I imported, shown in the table above
FMACHN<-Surv(all$Time[all$Treatment=="FMACHN"], all$Alive[all$Treatment=="FMACHN"])
FMACHN.fit<-survfit(FMACHN~1)
summary(FMACHN.fit)
#the result of this summary is listed in the code block above
如果有人能够破译R在Kaplan-Meier幸存者功能中的表现与我通过手动实现该功能所做的不同,我会非常感激!或者如果我的数据设置有问题,那么这也很好。
提前致谢!请随时要求澄清任何事情 - 我知道这是一个很长的帖子!