像这样,我们有500个条目。参赛作品可能会重复。
日期表示特定汽车部件(汽车部件)发生故障的日期。我们必须预测汽车部件(汽车部件)将在哪个日期发生故障。
代码用R编写。开发表的代码如下: -
q<-c("Mercedes","Audi","Tata","Renault","Ferrari","Lamborgini")
w<-sample(q,500,replace=TRUE)
m <- c("accelerator", "gear", "coolant", "brakes", "airbags")
k <- sample(m, 500, replace=TRUE)
e <- seq(as.Date("2010/1/1"), as.Date("2011/1/1"), by="days")
l <- sample(e, 500, replace=TRUE)
test <- list(w,k, l)
t2 <- as.data.frame(test)
names(t2) <- c("carnames","carparts", "date")
t2$Diffdate<-as.numeric(t2$date-as.Date("2010-01-01"))
head(t2)
我正在为生存分析准备我的数据。在上面的代码中,我没有包含检查器和事件变量。(我尝试了草稿,它变得很乱。)我只需要知道如何包含事件和审查变量以及carparts变量和carnames变量。我陷入困境,因为我无法在单个表中构建所有变量。
我面临的两个问题是: -
1&GT;我无法找到一种方法将carparts,carnames,event和censor变量保存在一个表格中。
2 - ;并且事件变量在每个条目中始终为1,因为对于每个条目(行)都存在carparts发生故障/缺陷。是否可以这样做?
在我从互联网上看到的所有例子中,事件变量都有1和0。
编辑1: - 没有必要在R中执行此操作,您可以将其写下来(将包括列中的列以及检查器和事件变量的表格绘制在一张纸上)并附上快照。
由于