我有几个数据框,其中有一些匹配的列(名称上),我想知道多少列。我现在正在使用此功能来合并它们:
dflist <- list(d1, d2)
Reduce(function(x, y) merge(x, y, all=TRUE), dflist, accumulate=FALSE)
但是我不知道有多少匹配,直到我查看它。另外,我想删除不匹配的列,而不是填写NA。
编辑,添加示例:
d1 = mtcars
d2 = mtcars[, 1:4]
d3 = mtcars[, 3:5]
dflist = list(d1,d2,d3)
dflist <- list(d1, d2)
Reduce(function(x, y) merge(x, y, all=TRUE), dflist, accumulate=FALSE
答案 0 :(得分:5)
这是一个例子:
d1 = mtcars
d2 = mtcars[, 1:4]
d3 = mtcars[, 3:5]
dflist = list(d1,d2,d3)
现在可以在df列表中获取匹配的列名称:
Reduce(intersect, lapply(dflist, names))
# [1] "disp" "hp"
然后可以仅使用选定的公共列继续合并过程,例如使用:
common_cols = Reduce(intersect, lapply(dflist, names))
Reduce(function(...) merge(..., all=TRUE),
lapply(dflist, function(x) x[, common_cols, drop=FALSE]))