Kaplan Meier生存曲线结果在R和SAS之间有所不同?

时间:2014-04-02 19:54:15

标签: r sas survival-analysis

我使用该出版物中使用的确切数据集(Charpentier et al.2008 - Inmeding depression in ring-tailed lemurs(Lemur catta))从以前发表的数据中重新运行Kaplan-Meier生存曲线:遗传多样性预测寄生,免疫能力和生存)。该出版物使用LIFETEST在SAS Version 9中运行曲线,以分析由遗传杂合性和动物性别构成的死亡年龄(n = 64)。她报告的卡方值为6.31,p值为0.012;但是,当我在R中运行曲线时,我得到Chi平方值0.9和p值0.821。谁能解释一下这个??

使用的R代码:年龄是死亡的时间,mort是审查代码,性别是性别的阶层,而ho2是描述要比较的两个群体的因素。

> survdiff(Surv(age, mort1)~ho2+sex,data=mariekmsurv1)
Call:
survdiff(formula = Surv(age, mort1) ~ ho2 + sex, data = mariekmsurv1)

              N Observed Expected (O-E)^2/E (O-E)^2/V
ho2=1, sex=F 18        3     3.23    0.0166    0.0215
ho2=1, sex=M 12        3     2.35    0.1776    0.2140
ho2=2, sex=F 17        5     3.92    0.3004    0.4189
ho2=2, sex=M 17        4     5.50    0.4088    0.6621

Chisq= 0.9  on 3 degrees of freedom, p= 0.821 


> str(mariekmsurv1)
'data.frame':   64 obs. of  6 variables:
 $ id   : Factor w/ 65 levels "","aeschylus",..: 14 31 33 30 47 57 51 39 36 3 ...
 $ sex  : Factor w/ 3 levels "","F","M": 3 2 3 2 2 2 2 2 2 2 ...
 $ mort1: int  0 0 0 0 0 0 0 0 0 0 ...
 $ age  : num  0.12 0.192 0.2 0.23 1.024 ...
 $ sex.1: Factor w/ 3 levels "","F","M": 3 2 3 2 2 2 2 2 2 2 ...
 $ ho2  : int  1 1 1 2 1 1 1 1 1 2 ...
- attr(*, "na.action")=Class 'omit'  Named int [1:141] 65 66 67 68 69 70 71 72 73 74 ...
  .. ..- attr(*, "names")= chr [1:141] "65" "66" "67" "68" ...

2 个答案:

答案 0 :(得分:0)

一些想法:

尝试在SAS中运行它 - 看看你是否得到了与作者相同的结果。也许他们没有向您发送他们使用的完全相同的数据集。

查看相关SAS PROC的默认值,并与您正在使用的R功能的默认值进行比较。

答案 1 :(得分:0)

鉴于SAS程序和R程序之间的卡方(6.81和0.9)和P值(0.012和0.821)之间的巨大差异,用于生存分析;我怀疑您在任一过程中使用了错误的变量。

程序差异/(SAS和R之间的数据处理差异可能会导致一些很小的差异)。

这不是软件错误,这很可能是人为错误。