R:用另一个数据帧中相同位置的值替换data.frame中的NA

时间:2016-12-15 23:41:24

标签: r dataframe na

我有一个带有一些NA值的数据框:

dfa <- data.frame(a=c(1,NA,3,4,5,NA),b=c(1,5,NA,NA,8,9),c=c(7,NA,NA,NA,2,NA))
dfa

我想用另一个数据帧中相同位置的值替换NA:

dfrepair <- data.frame(a=c(2:7),b=c(6:1),c=c(8:3))
dfrepair

我试过了:

dfa1 <- dfa

dfa1 <- ifelse(dfa == NA, dfrepair, dfa)
dfa1

但这不起作用。

4 个答案:

答案 0 :(得分:20)

你可以这样做:

dfa <- data.frame(a=c(1,NA,3,4,5,NA),b=c(1,5,NA,NA,8,9),c=c(7,NA,NA,NA,2,NA))
dfrepair <- data.frame(a=c(2:7),b=c(6:1),c=c(8:3))
dfa[is.na(dfa)] <- dfrepair[is.na(dfa)]
dfa

  a b c
1 1 1 7
2 3 5 7
3 3 4 6
4 4 3 5
5 5 8 2
6 7 9 3

答案 1 :(得分:8)

在tidyverse中,您可以使用purrr::map2_df,它是mapply的严格双变量版本,可简化为data.frame,而dplyr::coalesce可取代NA第一个参数中的值与第二个中相应的值。

library(tidyverse)

dfrepair %>% 
    mutate_all(as.numeric) %>%    # coalesce is strict about types
    map2_df(dfa, ., coalesce)

## # A tibble: 6 × 3
##       a     b     c
##   <dbl> <dbl> <dbl>
## 1     1     1     7
## 2     3     5     7
## 3     3     4     6
## 4     4     3     5
## 5     5     8     2
## 6     7     9     3

答案 2 :(得分:7)

我们可以使用Map中的base R来对两个数据集进行逐列比较

dfa[] <- Map(function(x,y) {x[is.na(x)] <- y[is.na(x)]; x}, dfa, dfrepair)
dfa
#  a b c
#1 1 1 7
#2 3 5 7
#3 3 4 6
#4 4 3 5
#5 5 8 2
#6 7 9 3

答案 3 :(得分:2)

dfa <- data.frame(a=c(1,NA,3,4,5,NA),b=c(1,5,NA,NA,8,9),c=c(7,NA,NA,NA,2,NA))
dfa
dfrepair <- data.frame(a=c(2:7),b=c(6:1),c=c(8:3))
dfrepair 
library(dplyr)
coalesce(as.numeric(dfa), as.numeric(dfrepair))

  a b c
1 1 1 7
2 3 5 7
3 3 4 6
4 4 3 5
5 5 8 2
6 7 9 3

由于dplyr中的代码是用C ++编写的,因此在大多数情况下更快。另一个重要的优点是coalesce以及许多其他dplyr函数在SQL中是相同的。使用dplyr,您可以通过R编码来学习SQL。 ; - )