感谢您花时间看我的问题!我是论坛的新手,也是R的新手,但我会尽力明确地提出问题。
我有一大组树样本数据,每个人的行数不规则。在“类”变量列(此处为第2列)中,每个个体的第一行具有值(1,2,3或4),后续的行为NA。 我想将每个人的第一个值分配给相应的后续NA细胞(属于同一个体)。
可重复的示例数据框(已编辑):
test <- cbind(c(1, 2, 3, NA, 4, NA, NA, NA, 5, NA, 6), c(3, 4, 3, NA, 1, NA, NA, NA, 2, NA, 1))
colnames(test) <- c("ID", "class")
ID class
[1,] 1 3
[2,] 2 4
[3,] 3 3
[4,] NA NA
[5,] 4 1
[6,] NA NA
[7,] NA NA
[8,] NA NA
[9,] 5 2
[10,] NA NA
[11,] 6 1
我正在寻找的结果是:
ID class
[1,] 1 3
[2,] 2 4
[3,] 3 3
[4,] NA 3
[5,] 4 1
[6,] NA 1
[7,] NA 1
[8,] NA 1
[9,] 5 2
[10,] NA 2
[11,] 6 1
我复制了此主题的最后一个解决方案How to substitute several NA with values within the DF using if-else in R? 并尝试根据我的需要调整它
test2 <- as.data.frame(t(apply(test["class"], 1, function(x)
if(is.na(x[1]) == FALSE && all(is.na(head(x[1], -1)[-1])))
replace(x, is.na(x), x[1]) else x)))
但它给了我错误“dim(x)必须有正长度”。我尝试了很多其他版本,它给了我各种各样的错误,我甚至不知道从哪里开始。我该如何改进呢?
答案 0 :(得分:2)
如果你不想加载另一个套餐,这里有一个小的单行功能:
rollForward <- function(x) {
c(NA, x[!is.na(x)])[cumsum(!is.na(x)) + 1]
}
test[,"class"] <- rollForward(test[,"class"])
test
# ID class
# [1,] 1 3
# [2,] 2 4
# [3,] 3 3
# [4,] NA 3
# [5,] 4 1
# [6,] NA 1
# [7,] NA 1
# [8,] NA 1
# [9,] 5 2
# [10,] NA 2
# [11,] 6 1