将函数应用于数据框

时间:2012-10-10 21:11:45

标签: r plyr

我无法弄清楚为什么这不起作用。我有一个包含5列n行的数据集。我只想对每一行应用一个函数,并以n×1向量返回结果。

为了测试一切是如何工作的,我做了这个简单的功能:

f1 <- function(uniqueid,Perspvalue,expvalue,stddevi,stddevc) {
    uniqueid+ Perspvalue- expvalue+ stddevi+stddevc
}

这是我的数据集的前几行:

> data
     uniqueid   Perspvalue    expvalue      stddevi      stddevc
1           1 2.404421e+03  3337239.00 8.266566e+03 3.324624e+03
2           2 1.345307e+03  3276559.87 7.068823e+03 2.648072e+03
3           3 1.345307e+03  3276559.87 7.068823e+03 2.648072e+03

请注意,它是一个数据框(我认为),而不是矩阵。我使用read.csv从csv加载了数据。

所以我试试这个:apply(data,1,f1)

但我的结果是:Error in uniqueid + Perspvalue : 'Perspvalue' is missing

我期待一个数字而不是错误。

1 个答案:

答案 0 :(得分:7)

您需要使用mapply来实现这一目标,或者从plyr包中使用mdply

一些示例代码:

spam_function = function(a, b) {
  return(a*b)
}

require(plyr)
input_args = data.frame(a = runif(1000), b = runif(1000))
result = mdply(input_args, spam_function)
> head(result)
           a         b         V1
1 0.46902575 0.6865863 0.32202668
2 0.56837805 0.2400993 0.13646717
3 0.07185661 0.2334754 0.01677675
4 0.15589191 0.6636891 0.10346377
5 0.98317092 0.8895609 0.87459042
6 0.46070479 0.4301685 0.19818071

如果您只想要结果向量:

result_vector = result$V1

或者,使用mapply

的基本R解决方案
result_mapply = mapply(spam_function, a = input_args$a, b = input_args$b)
> head(result_mapply)
[1] 0.2757767 0.1268879 0.5851026 0.7904186
[5] 0.2186079 0.1091692