如何将CoperPH模型的PPER格式转换为SPELL格式

时间:2015-05-04 15:46:13

标签: survival-analysis traminer cox-regression

CoxPH生存分析

我有一个PPER(人物周期)格式的数据集,如:

Machine_id,时间戳,事件,TDV1,TDV2,TDV3,TDV4 TDV1 / 2是因素(品牌,位置)TDV3 / 4是连续的(温度,湿度)

需要转换为SPELL格式,如: Machine_id,start.time,stop.time,事件,TDV1,TDV2,TDV3,TDV4

我可以使用seqdef()&转换为从SPELL转换为PPER。 TraMineRextras中的toPersonPeriod()

需要帮助才能做到相反。还有从PPER到SPELL格式时如何处理连续变量?

1 个答案:

答案 0 :(得分:0)

人员周期数据只是拼写数据的一个特例,其中开始和结束时间相同。您可以通过复制Timestamp变量并重命名第一个start.time和第二个stop.time来获取拼写数据。

您可以使用list=c(Machine_id, event, TDV1, TDV2, TDV3, TDV4)作为by参数汇总您的记录。继续进行两次,一次使用FUN="min",一次使用FUN="max",您应该能够找到event和协变量值不变的法术的开始和结束时间。

I illustrate here with an example

## creating example data
p.df <- data.frame(scan(what=list(Id=0, timestamp=0, event="", work="", income=0)))
1 2000 S working 100
1 2001 S working 100
1 2002 M working 100
1 2003 M working 100
1 2004 M jobless 80
1 2005 M jobless 70
2 2000 S jobless 10
2 2001 S working 100
2 2002 S working 100

## leave previous line blank to end scan

p.df$start <- p.df$timestamp
p.df$end <- p.df$timestamp
p.df <- p.df[,-2]  ## deleting timestamp variable

bylist <- list(id = p.df$Id, event=p.df$event,
      work=p.df$work, income=p.df$income)
spell1 <- aggregate(p.df[,c("start","end")], by=bylist, FUN="min")
spell2 <- aggregate(p.df[,c("start","end")], by=bylist, FUN="max")

## reordering columns
spell <- spell1[,c(1,5,6,2,3,4)]
spell[,3] <- spell2[,6] ## taking end value from spell2
spell <- spell[order(spell$id,spell$start),] ## sorting rows
spell

##   id start  end event    work income
## 5  1  2000 2001     S working    100
## 4  1  2002 2003     M working    100
## 3  1  2004 2004     M jobless     80
## 2  1  2005 2005     M jobless     70
## 1  2  2000 2000     S jobless     10
## 6  2  2001 2002     S working    100

希望这有帮助。