如何用lapply定义多个变量?

时间:2018-02-03 14:57:02

标签: r function variables lapply

我想将具有不同值的多个变量的函数应用于列表。我知道如何使用一个变化的变量

来做到这一点
sapply(c(1:10), function(x) x * 2)
# [1]  2  4  6  8 10 12 14 16 18 20

但不是两个。我首先手动向您展示我想要的内容(实际上我使用lapply()sapply()在SO中更具概要性:

# manual
a <- sapply(c(1:10), function(x, y=2) x * y)
b <- sapply(c(1:10), function(x, y=3) x * y)
c <- sapply(c(1:10), function(x, y=4) x * y)
c(a, b, c)
# [1]  2  4  6  8 10 12 14 16 18 20  3  6  9 12 15 18 21 24 27 30  4  8 12 
# [24]  16 20 24 28 32 36 40

这是我尝试定义xy的尝试。

# attempt
X <- list(x = 1:10, y = 2:4)
sapply(c(1:10, 2:4), function(x, y) x * y)
# Error in FUN(X[[i]], ...) : argument "y" is missing, with no default

解决方案的基准

library(microbenchmark)
microbenchmark(sapply = as.vector(sapply(1:10, function(x, y) x * y, 2:4)), 
               mapply = mapply( FUN = function(x, y) x * y, 1:10, rep( x = 2:4, each = 10)),
               sapply2 = as.vector(sapply(1:10, function(y) sapply(2:4, function(x) x * y))),
               outer = c(outer(1:10, 2:4, function(x, y) x * y)))
# Unit: microseconds
# expr        min       lq      mean   median       uq      max neval
# sapply   34.212  36.3500  62.44864  39.1295  41.9090 2304.542   100
# mapply   62.008  65.8570  87.82891  70.3470  76.5480 1283.342   100
# sapply2 196.714 203.9835 262.09990 223.6550 232.2080 3344.129   100
# outer     7.698  10.4775  13.02223  12.4020  13.4715   53.883   100

4 个答案:

答案 0 :(得分:6)

使用mapply()

mapply()将函数应用于多个列表或向量参数。

rep()也用于重复值2,3和4.在each参数中指定10,rep()重复x的每个元素10次。

这是必要的,因为mapply() - 1:10中的第一个参数长度为10。

# supply the function first, followed by the
# arguments in the order in which they are called in `FUN`
mapply( FUN = function(x, y) x * y
        , 1:10
        , rep( x = 2:4, each = 10)
)

# [1]   2  4  6  8 10 12 14 16 18 20  3  6  9 12 15 18 21 24 27 30  4  8 12 16 20
# [26] 24 28 32 36 40

答案 1 :(得分:6)

首先,如果您的函数是矢量化的,那么只需使用lapply()即可。在这种情况下,它是:

x <- 1:10
unlist(lapply(2:4, function(y) x*y))
# OR
unlist(lapply(2:4, function(x=x,y) x*y))

其次,如果您需要对两个向量的每个组合应用函数,请使用outer()

xf <- 1:10
yf <- 2:4
c(xf %o% yf)
# OR spelled out for any function:
c(outer(xf,yf,FUN = `*`))

如果你使用mapply,你可以使用参数MoreArgs来避免使用rep来构造你的参数:

xf <- 1:10
yf <- 2:4
mapply(function(x,y) x*y,
       y = yf,
       MoreArgs = list(x = xf))

这与我上面显示的lapply()构造完全等效。也可以使用SIMPLIFY = FALSEunlist()

将生成的矩阵转换为矢量
unlist(mapply(function(x,y) x*y,
              y = yf,
              MoreArgs = list(x = xf),
              SIMPLIFY = FALSE))

哪种解决方案最方便,取决于您的实际用例。时间方面它们都具有可比性,在最近的R版本中,outer()可能比其他解决方案慢一点。

基准

为了显示结果如何根据对象的大小和顺序而大不相同,我包括以下基准测试结果(下面的代码和输出)。这表明:

  1. outer()不一定是最快的解决方案,尽管它通常是最快的解决方案之一。
  2. mapply()中手动重复一个向量会增加很多开销,即使双sapply()次调用也会更快。
  3. 代码:警告:这会运行一段时间

    fx <- sample(1e4)
    fy <- sample(1e3)
    library(microbenchmark)
    microbenchmark(sapply = as.vector(sapply(fx, function(x, y) x * y, fy)), 
                   mapply = mapply( FUN = function(x, y) x * y, fx, rep( fy, each = 1e4)),
                   sapply2 = as.vector(sapply(fx, function(y) sapply(fy, function(x) x * y))),
                   outer = c(outer(fx, fy, function(x, y) x * y)),
                   mapply2 = mapply(function(x,y) x*y, x=fx, MoreArgs = list(y = fy)),
                   mapply3 = mapply(function(x,y) x*y, y=fy, MoreArgs = list(x = fx)),
                   times = 15)
    

    我机器上的输出:

    Unit: milliseconds
        expr         min          lq       mean      median          uq        max neval cld
      sapply    89.52318    92.98653   344.1538   117.11280   239.64887  1485.3178    15 a  
      mapply 20471.02137 22925.42757 24478.5985 24650.29055 25627.31232 28840.3494    15   c
     sapply2  7472.02251  8268.04696  9519.8016  8707.19193  9528.46181 14182.7537    15  b 
       outer    77.62331    85.94651   189.5107    91.83722   182.08506  1119.6620    15 a  
     mapply2    77.76871    79.71924   143.9484    81.24168    84.53247   971.1792    15 a  
     mapply3    65.21709    71.85662   107.9586    73.80779   124.21141   242.0760    15 a  
    

答案 2 :(得分:6)

一般解决方案

尝试outer

c(outer(1:10, 2:4, Vectorize(function(x, y) x*y)))
##  [1]  2  4  6  8 10 12 14 16 18 20  3  6  9 12 15 18 21 24 27 30  4  8 12 16 20
## [26] 24 28 32 36 40

如果功能已经过矢量化

如果函数已经被矢量化,就像在这里一样,那么我们可以省略Vectorize

c(outer(1:10, 2:4, function(x, y) x * y))
##  [1]  2  4  6  8 10 12 14 16 18 20  3  6  9 12 15 18 21 24 27 30  4  8 12 16 20
## [26] 24 28 32 36 40

问题所示的特定示例

事实上,在这种特殊情况下,显示的匿名函数是默认函数,因此可以使用:

c(outer(1:10, 2:4))
##  [1]  2  4  6  8 10 12 14 16 18 20  3  6  9 12 15 18 21 24 27 30  4  8 12 16 20
## [26] 24 28 32 36 40

同样在这种特殊情况下我们可以使用:

c(1:10 %o% 2:4)
##  [1]  2  4  6  8 10 12 14 16 18 20  3  6  9 12 15 18 21 24 27 30  4  8 12 16 20
## [26] 24 28 32 36 40

如果输入是列表X

如果您的起点是问题中显示的列表X,那么:

c(outer(X[[1]], X[[2]], Vectorize(function(x, y) x * y)))
##  [1]  2  4  6  8 10 12 14 16 18 20  3  6  9 12 15 18 21 24 27 30  4  8 12 16 20
## [26] 24 28 32 36 40

c(do.call("outer", c(unname(X), Vectorize(function(x, y) x*y))))
##  [1]  2  4  6  8 10 12 14 16 18 20  3  6  9 12 15 18 21 24 27 30  4  8 12 16 20
## [26] 24 28 32 36 40

如果适用,前面部分适用于缩短它。

答案 3 :(得分:3)

另一个想法是两次使用sapply

as.vector(sapply(2:4, function(y) sapply(1:10, function(x) x * y)))
[1]  2  4  6  8 10 12 14 16 18 20  3  6  9 12 15 18 21 24 27 30  4  8 12 16 20 24 28 32 36 40

或者我们可以使用map2_int包中的purrrmap2_int可以遍历两个长度相同的向量,并确保输出为整数。因此,我们需要使用rep(a, length(b))rep(b, each = length(a))来确保每个元素都已配对。 ~.x * .y是在purrr中指定功能的简洁方法。

library(purrr)

a <- 1:10
b <- 2:4
map2_int(rep(a, length(b)), rep(b, each = length(a)), ~.x * .y)
# [1]  2  4  6  8 10 12 14 16 18 20  3  6  9 12 15 18 21 24 27 30  4  8 12 16 20 24 28 32 36 40