如何根据多个条件在data.table中生成新列?

时间:2016-01-26 01:27:46

标签: r data.table

如何根据多个条件在data.table中生成新列?

如果它在data.frame环境中,我可以使用以下代码。

df<-data.frame(a=c(1,2,3,4,5,6,7,8,9,10),b=c(10,20,30,40,50,60,70,80,90,100))
df$c<-ifelse(df$b<=30,"G1",
             ifelse(df$b>30 & df$b<=60, "G2",
                    ifelse(df$b>60 & df$b<=80, "G3",
                           ifelse(df$b>80 & df$b<=90, "G4","G5"))))

在data.table环境中,我知道我可以使用

dt<-data.table(a=c(1,2,3,4,5,6,7,8,9,10),b=c(10,20,30,40,50,60,70,80,90,100))
dt[,d:=...]

生成新列。但是如何使用dt [,d:= ...]生成dt $ c?

我有多愚蠢?我没试过。下面有一个工作。

dt<-data.table(a=c(1,2,3,4,5,6,7,8,9,10),b=c(10,20,30,40,50,60,70,80,90,100))
dt[,d:=ifelse(b<=30,"G1",
              ifelse(b>30 & b<=60, "G2",
                     ifelse(b>60 & b<=80, "G3",
                            ifelse(b>80 & b<=90, "G4","G5"))))]

由于

1 个答案:

答案 0 :(得分:5)

对于涉及基于一系列值进行重新编码的案例,基函数cut有很大帮助:

dt[,d:= cut(b, c(-Inf, 30, 60, 80, 90, Inf), paste0("G", 1:5))]