使用R将函数应用于数据框中两列的每个组合

时间:2015-10-27 15:18:20

标签: r dataframe multiple-columns apply

我想将函数myfoo应用于数据框mydf中两列的每个可能组合,并以矩阵格式myoutput获取结果。

考虑以下数据框,

# Example dataframe
mydf <- data.frame(var1 = 1:10, var2 = 11:20, var3 = 21:30)
head(mydf)

# var1 var2 var3
# 1    11   21
# 2    12   22
# 3    13   23
# 4    14   24
# 5    15   25

我想将以下函数应用于两列的每个可能组合,

# Example function
myfoo <- function(varA, varB) sum(varA * varB)

myfoo(var1, var2)
# [1] 935

以获得此输出。

# Desired output
myoutput <- matrix(c(0, 935, 1485, 935, 0, 4035, 1485, 4035, 0), 3, dimnames = list(names(mydf), names(mydf)))
myoutput

#      var1 var2 var3
# var1    0  935 1485
# var2  935    0 4035
# var3 1485 4035    0

1 个答案:

答案 0 :(得分:3)

在你的情况下,我将转换为矩阵(当所有列都是数字类时,没有理由将它保持为data.frame)并且只运行编译矩阵交叉乘积的编译crossprod函数。

m <- as.matrix(mydf)
res <- crossprod(m, m)
diag(res) <- 0 # You can probably skip that part
res
#      var1 var2 var3
# var1    0  935 1485
# var2  935    0 4035
# var3 1485 4035    0