Question

如果我有两个数据框，例如：

df1 = data.frame(x=1:3,y=1:3,row.names=c('r1','r2','r3'))
df2 = data.frame(z=5:7,row.names=c('r5','r6','r7'))

（

R> df1
   x y
r1 1 1
r2 2 2
r3 3 3

R> df2
   z
r5 5
r6 6
r7 7

），我想按行名称合并它们，保留所有内容（所以外连接，或全部= T）。这样做：

merged.df <- merge(df1,df2,all=T,by='row.names')
R> merged.df
  Row.names  x  y  z
1        r1  1  1 NA
2        r2  2  2 NA
3        r3  3  3 NA
4        r5 NA NA  5
5        r6 NA NA  6
6        r7 NA NA  7

但我希望输入行名称是输出数据框中的行名称（merged.df）。

我能做到：

rownames(merged.df) <- merged.df[[1]]
merged.df <- merged.df[-1]

有效，但似乎不优雅，难以记住。有人知道更干净的方式吗？

Answer 1

不确定是否更容易记住，但您可以使用transform一步完成所有操作。

transform(merge(df1,df2,by=0,all=TRUE), row.names=Row.names, Row.names=NULL)
#    x  y  z
#r1  1  1 NA
#r2  2  2 NA
#r3  3  3 NA
#r5 NA NA  5
#r6 NA NA  6
#r7 NA NA  7

Answer 2

在merge的帮助下：

如果匹配涉及行名，则会调用一个额外的字符列 Row.names添加在左侧，并且在所有情况下结果都有 '自动'行名。

很明显，您至少使用Row.names无法避免使用merge列。但也许要删除此列，您可以按名称而不是索引进行子集化。例如：

dd <- merge(df1,df2,by=0,all=TRUE) ## by=0 easier to write than row.names , 
                                   ## TRUE is cleaner than T

然后我使用row.names这样的子集：

res <- subset(dd,select=-c(Row.names))
rownames(res) <- dd[,'Row.names']
  x  y  z
1  1  1 NA
2  2  2 NA
3  3  3 NA
4 NA NA  5
5 NA NA  6
6 NA NA  7

如何在不添加“Row.names”列的情况下按行名合并数据帧？

2 个答案: