将细胞值分配给后续NA细胞的功能(同一列)

时间:2015-03-03 21:00:29

标签: r if-statement na

感谢您花时间看我的问题!我是论坛的新手,也是R的新手,但我会尽力明确地提出问题。

我有一大组树样本数据,每个人的行数不规则。在“类”变量列(此处为第2列)中,每个个体的第一行具有值(1,2,3或4),后续的行为NA。 我想将每个人的第一个值分配给相应的后续NA细胞(属于同一个体)。

可重复的示例数据框(已编辑):

test <- cbind(c(1, 2, 3, NA, 4, NA, NA, NA, 5, NA, 6), c(3, 4, 3, NA, 1, NA, NA, NA, 2, NA, 1))
colnames(test) <- c("ID", "class")

        ID  class
 [1,]    1    3
 [2,]    2    4
 [3,]    3    3
 [4,]   NA   NA
 [5,]    4    1
 [6,]   NA   NA
 [7,]   NA   NA
 [8,]   NA   NA
 [9,]    5    2
[10,]   NA   NA
[11,]    6    1

我正在寻找的结果是:

      ID class
 [1,]  1     3
 [2,]  2     4
 [3,]  3     3
 [4,] NA     3
 [5,]  4     1
 [6,] NA     1
 [7,] NA     1
 [8,] NA     1
 [9,]  5     2
[10,] NA     2
[11,]  6     1

我复制了此主题的最后一个解决方案How to substitute several NA with values within the DF using if-else in R? 并尝试根据我的需要调整它

    test2 <- as.data.frame(t(apply(test["class"], 1, function(x)
    if(is.na(x[1]) == FALSE && all(is.na(head(x[1], -1)[-1])))
    replace(x, is.na(x), x[1]) else x)))

但它给了我错误“dim(x)必须有正长度”。我尝试了很多其他版本,它给了我各种各样的错误,我甚至不知道从哪里开始。我该如何改进呢?

1 个答案:

答案 0 :(得分:2)

如果你不想加载另一个套餐,这里有一个小的单行功能:

rollForward <- function(x) {
    c(NA, x[!is.na(x)])[cumsum(!is.na(x)) + 1]
}

test[,"class"] <- rollForward(test[,"class"])
test
#       ID class
#  [1,]  1     3
#  [2,]  2     4
#  [3,]  3     3
#  [4,] NA     3
#  [5,]  4     1
#  [6,] NA     1
#  [7,] NA     1
#  [8,] NA     1
#  [9,]  5     2
# [10,] NA     2
# [11,]  6     1