根据几种条件替换df中的某些值

时间:2020-03-12 20:24:24

标签: r database merge

一个基本问题,但是我正在寻找一个很好的解决方案(不适用于循环),如果满足以下几个条件,就可以用DF2​​的值替换DF1中的条件:

DF1
Name  Year   Val1
A    2010     x1
A    2012     x2
B    2012     x3
C    2015     x4
C    2012     x5
DF2
Name  Year   Val1
A    2012     y1
B    2012     y2
C    2012     y3

如果在这种情况下Year是某个值(例如2012),并且DF1和DF2的名称相同,则将DF2中的Val1分配给DF1。

我尝试了几件事: DF1$Val1[DF1$Year=="2012"&DF1$Name==DF2$Name,] <-DF2$Val1 DF1$Val1<-replace(DF1$Val1, DF1$Year=="2012" & DF1$Name==DF2$Name, DF2$Val1)

但是不幸的是我得到一个错误,因为DF1和DF2的长度不同。

预期:

DF1
Name  Year   Val1
A    2010     x1
A    2012     y1
B    2012     y2
C    2015     x4
C    2012     y3

谢谢您的帮助!

4 个答案:

答案 0 :(得分:1)

我们可以将列ondata.table连接起来,并更新'Val'

librar(data.table)
setDT(DF1)[DF2, Val1 := i.Val1, on = .(Name, Year)]
DF1
#   Name Year Val1
#1:    A 2010   x1
#2:    A 2012   y1
#3:    B 2012   y2
#4:    C 2015   x4
#5:    C 2012   y3

数据

DF1 <- structure(list(Name = c("A", "A", "B", "C", "C"), Year = c(2010L, 
2012L, 2012L, 2015L, 2012L), Val1 = c("x1", "x2", "x3", "x4", 
"x5")), class = "data.frame", row.names = c(NA, -5L))

DF2 <- structure(list(Name = c("A", "B", "C"), Year = c(2012L, 2012L, 
2012L), Val1 = c("y1", "y2", "y3")), class = "data.frame", row.names = c(NA, 
-3L))

答案 1 :(得分:0)

我认为最简单的方法是过滤掉DF2,然后将其附加到DF1。

所以

    DF2 <- dplyr::filter(DF2, Year==2012,
                     Name %in% unique(DF1$Name)
    DF1 <- dplyr::bind_rows(DF1, DF2)

答案 2 :(得分:0)

这是两个基本的R解决方案。

-使用match

inds <- match(data.frame(t(DF2[-3]),stringsAsFactors = FALSE),
              data.frame(t(DF1[-3]),stringsAsFactors = FALSE))
DF1$Val1[inds] <- DF2$Val1

这样

> DF1
  Name Year Val1
1    A 2010   x1
2    A 2012   y1
3    B 2012   y2
4    C 2015   x4
5    C 2012   y3

-使用merge + subset

DF1 <- subset(within(merge(DF1,DF2,by=c("Name","Year"),all.x = TRUE), 
                     Val1 <- ifelse(is.na(Val1.y),Val1.x,Val1.y)),
              select = names(DF1))

这样

> DF1
  Name Year Val1
1    A 2010   x1
2    A 2012   y1
3    B 2012   y2
4    C 2012   y3
5    C 2015   x4

答案 3 :(得分:0)

我们可以在left_joindf1df2 NameYear,然后使用coalesce从两个{ {1}}列。

Val1