编写一个带有参数的函数,该参数指示要应用的函数

时间:2012-05-02 21:32:29

标签: r

有没有办法编写一个函数,其中一个参数指示要应用的函数?

例如,如果我有一个功能:

mf = function(data, option, level)

我希望选择判断是否计算数据集的meanmediansd

2 个答案:

答案 0 :(得分:5)

是的,一个选项是将函数传递给option。 E.g。

mf <- function(data, option) {
    option <- match.fun(option)
    option(data)
}

set.seed(42)
dat <- rnorm(10)
mf(dat, option = mean)

给出了:

> set.seed(42)
> dat <- rnorm(10)
> mean(dat)
[1] 0.5472968
> mf(dat, option = mean)
[1] 0.5472968
> sd(dat)
[1] 0.8354488
> mf(dat, option = sd)
[1] 0.8354488

match.fun()是匹配可用函数的标准R方式。在示例中,我传递函数本身,但match.fun()允许其他方式引用函数,例如作为字符串:

> mf(dat, option = "mean")
[1] 0.5472968

match.fun()返回一个可以用作任何其他函数的函数,因此option()是一个与传递给option参数的函数基本相同的函数,或者是函数在option参数中命名。

我不清楚如何使用level参数来忽略上述情况。

我应该补充一点,如果你想将任何参数传递给应用函数,那么你将要在函数定义中使用...,例如:

mf <- function(data, option, ...) {
    option <- match.fun(option)
    option(data, ...)
}

因此我们可以做这样的事情

set.seed(42)
dat2 <- rnorm(10)
dat2[4] <- NA
mean(dat2)
mean(dat2, na.rm = TRUE)
mf(dat2, mean, na.rm = TRUE)

最后三行给出

> mean(dat2)
[1] NA
> mean(dat2, na.rm = TRUE)
[1] 0.5377895
> mf(dat2, mean, na.rm = TRUE)
[1] 0.5377895

答案 1 :(得分:4)

R中的“数据集”通常意味着数据帧并且没有median.data.frame,因此您需要同时使用lapply和do.call,这有一个问题:

  df <- data.frame(x=rnorm(10), y=rnorm(10))
 mf = function(data, option="mean") {lapply( data, 
                                       function(col) do.call(option, list(col))) }
 mf(df)
#-------------
$x
[1] 0.01646814

$y
[1] 0.5388518

你没有说明应该做什么“级别”,所以我把它排除在等式之外,

> mf(df, sd)
$x
[1] 1.169847

$y
[1] 0.8907117