计算几个数据帧之间匹配的列

时间:2019-03-07 09:23:51

标签: r dataframe merge data-manipulation

我有几个数据框,其中有一些匹配的列(名称上),我想知道多少列。我现在正在使用此功能来合并它们:

dflist <- list(d1, d2)
Reduce(function(x, y) merge(x, y, all=TRUE), dflist, accumulate=FALSE)

但是我不知道有多少匹配,直到我查看它。另外,我想删除不匹配的列,而不是填写NA。

编辑,添加示例:

d1 = mtcars
d2 = mtcars[, 1:4]
d3 = mtcars[, 3:5]
dflist = list(d1,d2,d3)

dflist <- list(d1, d2)
Reduce(function(x, y) merge(x, y, all=TRUE), dflist, accumulate=FALSE

1 个答案:

答案 0 :(得分:5)

这是一个例子:

d1 = mtcars
d2 = mtcars[, 1:4]
d3 = mtcars[, 3:5]
dflist = list(d1,d2,d3)

现在可以在df列表中获取匹配的列名称:

Reduce(intersect, lapply(dflist, names))
# [1] "disp" "hp" 

然后可以仅使用选定的公共列继续合并过程,例如使用:

common_cols = Reduce(intersect, lapply(dflist, names))

Reduce(function(...) merge(..., all=TRUE), 
       lapply(dflist, function(x) x[, common_cols, drop=FALSE]))