Question

像这样，我们有500个条目。参赛作品可能会重复。

enter image description here

日期表示特定汽车部件（汽车部件）发生故障的日期。我们必须预测汽车部件（汽车部件）将在哪个日期发生故障。

代码用R编写。开发表的代码如下： -

     q<-c("Mercedes","Audi","Tata","Renault","Ferrari","Lamborgini")
    w<-sample(q,500,replace=TRUE)

    m <- c("accelerator", "gear", "coolant", "brakes", "airbags")
    k <- sample(m, 500, replace=TRUE)

    e <- seq(as.Date("2010/1/1"), as.Date("2011/1/1"), by="days")
    l <- sample(e, 500, replace=TRUE)

   test <- list(w,k, l)
   t2   <- as.data.frame(test)
   names(t2) <- c("carnames","carparts", "date")

   t2$Diffdate<-as.numeric(t2$date-as.Date("2010-01-01"))
   head(t2)

我正在为生存分析准备我的数据。在上面的代码中，我没有包含检查器和事件变量。（我尝试了草稿，它变得很乱。）我只需要知道如何包含事件和审查变量以及carparts变量和carnames变量。我陷入困境，因为我无法在单个表中构建所有变量。

我面临的两个问题是： -

1＆GT;我无法找到一种方法将carparts，carnames，event和censor变量保存在一个表格中。

2 - ;并且事件变量在每个条目中始终为1，因为对于每个条目（行）都存在carparts发生故障/缺陷。是否可以这样做？

在我从互联网上看到的所有例子中，事件变量都有1和0。

编辑1： - 没有必要在R中执行此操作，您可以将其写下来（将包括列中的列以及检查器和事件变量的表格绘制在一张纸上）并附上快照。

由于

我想为生存分析建模准备我的数据

0 个答案: