R:将数字数据和NA传输到字符串中

时间:2015-08-21 10:11:14

标签: r string data.table na

变量Recence_Connexion_Jrs由" NA"组成。和一些数字(从1到100),我试图制作" NA"等于"没有打开",并且还将数字切割成3组,并且组的标签是字符串类型。 例如:

Recence_Connexion_Jrs           Connexion
      NA                         No open
      NA                         No open
      NA                         No open
      1                        connexion 0-7
      10                       connexion 7-30

我使用的代码:

setDT(newdata)[!duplicated(newdata),Connexion:=ifelse(is.na(Recence_Connexion_jrs),
"No Open",cut(Recence_Connexion_jrs,breaks=c(-Inf,7,30,+Inf),
labels=c("connexion 0-7","connexion 7-30","connexion 30+")))]

但它给出了错误的结果。

我该如何解决?

1 个答案:

答案 0 :(得分:3)

我建议分两步执行此操作:(1)完成后使用cut,以及(2)使用replace作为NA值。

这是一个关于向量的例子。没理由你不能在data.table中做类似的事情:

set.seed(123)
vec <- sample(c(1:40, NA), 100, TRUE)
new <- cut(vec, c(-Inf, 7, 30, +Inf), 
           labels=c("connexion 0-7", "connexion 7-30", "connexion 30+"))
new <- replace(as.character(new), is.na(new), "No open")

或者,在较小的data.table上,您可以更轻松地查看:

library(data.table)
DT <- data.table(vec = c(1, NA, 8, 20, NA, 32))
DT[, new := as.character(
  cut(vec, c(-Inf, 7, 30, +Inf),
      labels = c("connexion 0-7", "connexion 7-30", "connexion 30+")))][
        , new := replace(new, is.na(new), "No open")
      ][]    
#    vec            new
# 1:   1  connexion 0-7
# 2:  NA        No open
# 3:   8 connexion 7-30
# 4:  20 connexion 7-30
# 5:  NA        No open
# 6:  32  connexion 30+