如何用另一个的值替换一个data.frame中的值?

时间:2015-05-05 21:03:37

标签: r merge dplyr

我有两个data.frames - 第一个是编码的:

correlations <- data.frame(var1 = c('a','a','a','b','e'), var2 = c('b','c','d','e','c'), r = runif(5,0.5,1))
correlations

var1 var2          r
   a    b  0.6702400
   a    c  0.7301086
   a    d  0.5727880
   b    e  0.5916388
   e    c  0.5510549

,第二个包含该代码的密钥:

D <- data.frame(code = letters[1:5],name=c('setosa','bulbifer','rubra','minor','nigra'))
D

  code     name
   a     setosa
   b   bulbifer
   c      rubra
   d      minor
   e      nigra

我需要在第二个data.frame中通过变量Dcode重新编码第一个数据集name。 结果:

     var1     var2          r
   setosa bulbifer  0.6702400
   setosa    rubra  0.7301086
   setosa    minor  0.5727880
 bulbifer    nigra  0.5916388
    nigra    rubra  0.5510549

我不知道如何实现这一点(我需要一些函数,比如merge,substitute,Map或其他函数,但是没有什么比这更适合了。)

2 个答案:

答案 0 :(得分:2)

使用库dplyr

尝试此操作
library(dplyr)

D <- left_join(correlations, D, by=c("var1" ="code")) %>% 
  left_join(D, by=c("var2" ="code")) %>% select(name.x, name.y, r) %>% 
  rename(var1=name.x, var2=name.x)

逻辑是:correlations上的var1加一次,然后var2加入。然后删除旧var1var2,然后重命名新变量。

答案 1 :(得分:0)

或者你可以merge两次?使用&#34; var1&#34;代替&#34;代码&#34;作为代码表中的列名。

correlations <- data.frame(var1 = c('a','a','a','b','e'), var2 = c('b','c','d','e','c'), r = runif(5,0.5,1))
D <- data.frame(var1 = letters[1:5],name=c('setosa','bulbifer','rubra','minor','nigra'))

output1 <- merge(D, correlations, by = "var1", all.y = TRUE)
output1$var1 <- NULL
names(output1)[2] = "var1"
output2 <- merge(D, output1, by = "var1", all.y = TRUE)

> output2
  var1   name.x   name.y         r
1    b bulbifer   setosa 0.7328087
2    c    rubra   setosa 0.9492819
3    c    rubra    nigra 0.5884522
4    d    minor   setosa 0.9501921
5    e    nigra bulbifer 0.9266531