如何将一列的NA值替换为该列之后的值?

时间:2018-12-16 03:36:07

标签: r

以下是一些示例数据:

dat <- data.frame(col0 = c(1, 1, 1, 2, 2, 2, 3, 3, 3), 
       col1 = c(NA, 100, 100, NA, 200, 200, NA, 300, 300),
       col2 = c(1, 2, 3, 1, 2, 3, 1, 2, 3))

当col2 = 1时,我想更改col1中的任何NA值,其值应接续col1中的NA。

我能找出的最好的方法是

dat <- dat %>% 
       mutate(col1 = replace(col1, which(is.na(col1) & 
              col2 == 1), 100))

但是我不知道如何获得col1的下一个值...

理想情况下,解决方案将使用tidyverse。

我的实际数据集非常大,所以用c(100,200,300)代替col1中的NA并不是一种有效的方法。

2 个答案:

答案 0 :(得分:1)

我们可以使用fill包中的tidyr

library(tidyr)

dat2 <- fill(dat, col1, .direction = "up")
dat2
#   col0 col1 col2
# 1    1  100    1
# 2    1  100    2
# 3    1  100    3
# 4    2  200    1
# 5    2  200    2
# 6    2  200    3
# 7    3  300    1
# 8    3  300    2
# 9    3  300    3

答案 1 :(得分:1)

使用na.locf

的选项
library(zoo)
dat$col1 <- na.locf(dat$col1, fromLast = TRUE)
dat$col1
#[1] 100 100 100 200 200 200 300 300 300