变量Recence_Connexion_Jrs
由" NA"组成。和一些数字(从1到100),我试图制作" NA"等于"没有打开",并且还将数字切割成3组,并且组的标签是字符串类型。
例如:
Recence_Connexion_Jrs Connexion
NA No open
NA No open
NA No open
1 connexion 0-7
10 connexion 7-30
我使用的代码:
setDT(newdata)[!duplicated(newdata),Connexion:=ifelse(is.na(Recence_Connexion_jrs),
"No Open",cut(Recence_Connexion_jrs,breaks=c(-Inf,7,30,+Inf),
labels=c("connexion 0-7","connexion 7-30","connexion 30+")))]
但它给出了错误的结果。
我该如何解决?
答案 0 :(得分:3)
我建议分两步执行此操作:(1)完成后使用cut
,以及(2)使用replace
作为NA
值。
这是一个关于向量的例子。没理由你不能在data.table
中做类似的事情:
set.seed(123)
vec <- sample(c(1:40, NA), 100, TRUE)
new <- cut(vec, c(-Inf, 7, 30, +Inf),
labels=c("connexion 0-7", "connexion 7-30", "connexion 30+"))
new <- replace(as.character(new), is.na(new), "No open")
或者,在较小的data.table
上,您可以更轻松地查看:
library(data.table)
DT <- data.table(vec = c(1, NA, 8, 20, NA, 32))
DT[, new := as.character(
cut(vec, c(-Inf, 7, 30, +Inf),
labels = c("connexion 0-7", "connexion 7-30", "connexion 30+")))][
, new := replace(new, is.na(new), "No open")
][]
# vec new
# 1: 1 connexion 0-7
# 2: NA No open
# 3: 8 connexion 7-30
# 4: 20 connexion 7-30
# 5: NA No open
# 6: 32 connexion 30+