我想为生存分析建模准备我的数据

时间:2016-10-25 13:39:20

标签: r machine-learning prediction survival-analysis

像这样,我们有500个条目。参赛作品可能会重复。

enter image description here

日期表示特定汽车部件(汽车部件)发生故障的日期。我们必须预测汽车部件(汽车部件)将在哪个日期发生故障。

代码用R编写。开发表的代码如下: -

     q<-c("Mercedes","Audi","Tata","Renault","Ferrari","Lamborgini")
    w<-sample(q,500,replace=TRUE)

    m <- c("accelerator", "gear", "coolant", "brakes", "airbags")
    k <- sample(m, 500, replace=TRUE)

    e <- seq(as.Date("2010/1/1"), as.Date("2011/1/1"), by="days")
    l <- sample(e, 500, replace=TRUE)

   test <- list(w,k, l)
   t2   <- as.data.frame(test)
   names(t2) <- c("carnames","carparts", "date")

   t2$Diffdate<-as.numeric(t2$date-as.Date("2010-01-01"))
   head(t2)

我正在为生存分析准备我的数据。在上面的代码中,我没有包含检查器和事件变量。(我尝试了草稿,它变得很乱。)我只需要知道如何包含事件和审查变量以及carparts变量和carnames变量。我陷入困境,因为我无法在单个表中构建所有变量。

我面临的两个问题是: -

1&GT;我无法找到一种方法将carparts,carnames,event和censor变量保存在一个表格中。

2 - ;并且事件变量在每个条目中始终为1,因为对于每个条目(行)都存在carparts发生故障/缺陷。是否可以这样做?

在我从互联网上看到的所有例子中,事件变量都有1和0。

编辑1: - 没有必要在R中执行此操作,您可以将其写下来(将包括列中的列以及检查器和事件变量的表格绘制在一张纸上)并附上快照。

由于

0 个答案:

没有答案