用另一列中的值替换缺失值

时间:2016-03-22 10:14:53

标签: r missing-data

如果我有:

s <- data.frame(ID=c(191, 282, 202, 210), Group=c("", "A", "", "B"), stringsAsFactors=FALSE)
s
   ID Group
1 191      
2 282     A
3 202      
4 210     B

我可以像这样用N替换空单元格:

ds$Group[ds$Group==""]<-"N"

s
   ID Group
1 191     N 
2 282     A
3 202     N
4 210     B

但我需要用另一列中的值替换空单元格。我怎样才能做到这一点?:

s
   ID Group Group2
1 191     D      D
2 282     A      G
3 202     G      G
4 210     B      D

2 个答案:

答案 0 :(得分:4)

ifelse(test, yes, no)是一个方便的功能,它可以用于矢量。使用你上一次的data.frame:

s <- data.frame(ID = c(191, 282, 202, 210),
    Group = c("", "A", "", "B"),
    Group2 = c("D", "G", "G", "D"))

s$Group <- ifelse(test = s$Group != "", yes = s$Group, no = s$Group2)

第一个参数是测试。对于向量中的每个值,如果test为真,则它将采用yes中的值,否则将采用no中的值。

答案 1 :(得分:4)

我们可以使用data.table将“Group2”中的值分配到“Group”,其中“group”在“i”条件中指定为""

library(data.table)
setDT(s)[Group=="", Group:= Group2]

当任务到位时,它被认为是有效的。