R中的Gompertz老化分析

时间:2013-07-18 08:39:36

标签: r function survival-analysis

我从苍蝇实验中获得了生存数据,该实验检查了各种基因型的衰老率。我可以通过多种布局获取数据,因此您可以选择最适合您的答案。

一个数据帧(wide.df)看起来像这样,其中每个基因型(Exp,其中有~640)有一行,并且日期从第4天到第98天水平顺序运行,每个新死亡数量两天。

Exp      Day4   Day6    Day8    Day10   Day12   Day14    ...
A        0      0       0       2       3       1        ...

我使用这个做例子:

wide.df2<-data.frame("A",0,0,0,2,3,1,3,4,5,3,4,7,8,2,10,1,2)
colnames(wide.df2)<-c("Exp","Day4","Day6","Day8","Day10","Day12","Day14","Day16","Day18","Day20","Day22","Day24","Day26","Day28","Day30","Day32","Day34","Day36")

另一个版本是这样的,每个“Exp”每天都有一行,并记录当天的死亡人数。

Exp     Deaths  Day     
A       0       4    
A       0       6
A       0       8
A       2       10
A       3       12
..      ..      ..

举个例子:

df2<-data.frame(c("A","A","A","A","A","A","A","A","A","A","A","A","A","A","A","A","A"),c(0,0,0,2,3,1,3,4,5,3,4,7,8,2,10,1,2),c(4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36))
    colnames(df2)<-c("Exp","Deaths","Day")

我想要做的是执行 Gompertz分析 See second paragraph of "the life table" here)。等式是:

μx=α* e β* x

如果μx是给定时间的死亡概率,α是初始死亡率,β是衰老率。< / p>

我希望能够获得一个数据框,该数据框对我的~640个基因型中的每一个都有αβ估计值,以便以后进一步分析。

我需要帮助从上面的数据框到R中每个基因型的这些值的输出。

我查看了可能包含答案的软件包flexsurv,但我没有尝试查找和实施它。

1 个答案:

答案 0 :(得分:3)

这应该让你开始......

首先,要使flexsurvreg函数起作用,您需要将输入数据指定为Surv对象(来自package:survival)。这意味着每次观察一行。

第一件事是从您提供的汇总表中重新创建“原始”数据。 (我知道rbind效率不高,但您可以随时切换到大型集data.table

### get rows with >1 death
df3 <- df2[df2$Deaths>1, 2:3]
### expand to give one row per death per time
df3 <- sapply(df3, FUN=function(x) rep(df3[, 2], df3[, 1]))
### each death is 1 (occurs once)
df3[, 1] <- 1
### add this to the rows with <=1 death
df3 <- rbind(df3, df2[!df2$Deaths>1, 2:3])
### convert to Surv object
library(survival)
s1 <- with(df3, Surv(Day, Deaths))
### get parameters for Gompertz distribution
library(flexsurv) 
f1 <- flexsurvreg(s1 ~ 1, dist="gompertz")

给予

> f1$res
              est         L95%        U95%
shape 0.165351912 0.1281016481 0.202602176
rate  0.001767956 0.0006902161 0.004528537

请注意,这是一个仅限拦截的模型,因为您的所有基因型均为A。 一旦重新创建了 per-observation 数据,就可以将其循环到多个生存对象上。

来自flexsurv文档:

  

使用形状参数 a 和速率参数的Gompertz分布    b 具有危险功能

     

H(x:a,b)= b.e ^ {ax}

所以看来你的alpha b ,速度和beta a ,形状。