Question

一个基本问题，但是我正在寻找一个很好的解决方案（不适用于循环），如果满足以下几个条件，就可以用DF2的值替换DF1中的条件：

DF1
Name  Year   Val1
A    2010     x1
A    2012     x2
B    2012     x3
C    2015     x4
C    2012     x5

DF2
Name  Year   Val1
A    2012     y1
B    2012     y2
C    2012     y3

如果在这种情况下Year是某个值（例如2012），并且DF1和DF2的名称相同，则将DF2中的Val1分配给DF1。

我尝试了几件事： DF1$Val1[DF1$Year=="2012"&DF1$Name==DF2$Name,] <-DF2$Val1 DF1$Val1<-replace(DF1$Val1, DF1$Year=="2012" & DF1$Name==DF2$Name, DF2$Val1)

但是不幸的是我得到一个错误，因为DF1和DF2的长度不同。

预期：

DF1
Name  Year   Val1
A    2010     x1
A    2012     y1
B    2012     y2
C    2015     x4
C    2012     y3

谢谢您的帮助！

Answer 1

我们可以将列on与data.table连接起来，并更新'Val'

librar(data.table)
setDT(DF1)[DF2, Val1 := i.Val1, on = .(Name, Year)]
DF1
#   Name Year Val1
#1:    A 2010   x1
#2:    A 2012   y1
#3:    B 2012   y2
#4:    C 2015   x4
#5:    C 2012   y3

数据

DF1 <- structure(list(Name = c("A", "A", "B", "C", "C"), Year = c(2010L, 
2012L, 2012L, 2015L, 2012L), Val1 = c("x1", "x2", "x3", "x4", 
"x5")), class = "data.frame", row.names = c(NA, -5L))

DF2 <- structure(list(Name = c("A", "B", "C"), Year = c(2012L, 2012L, 
2012L), Val1 = c("y1", "y2", "y3")), class = "data.frame", row.names = c(NA, 
-3L))

Answer 2

我认为最简单的方法是过滤掉DF2，然后将其附加到DF1。

所以

    DF2 <- dplyr::filter(DF2, Year==2012,
                     Name %in% unique(DF1$Name)
    DF1 <- dplyr::bind_rows(DF1, DF2)

Answer 3

这是两个基本的R解决方案。

-使用match：

inds <- match(data.frame(t(DF2[-3]),stringsAsFactors = FALSE),
              data.frame(t(DF1[-3]),stringsAsFactors = FALSE))
DF1$Val1[inds] <- DF2$Val1

这样

> DF1
  Name Year Val1
1    A 2010   x1
2    A 2012   y1
3    B 2012   y2
4    C 2015   x4
5    C 2012   y3

-使用merge + subset：

DF1 <- subset(within(merge(DF1,DF2,by=c("Name","Year"),all.x = TRUE), 
                     Val1 <- ifelse(is.na(Val1.y),Val1.x,Val1.y)),
              select = names(DF1))

这样

> DF1
  Name Year Val1
1    A 2010   x1
2    A 2012   y1
3    B 2012   y2
4    C 2012   y3
5    C 2015   x4

Answer 4

我们可以在left_join和df1上df2 Name和Year，然后使用coalesce从两个{ {1}}列。

Val1

根据几种条件替换df中的某些值

4 个答案:

数据