有没有办法编写一个函数,其中一个参数指示要应用的函数?
例如,如果我有一个功能:
mf = function(data, option, level)
我希望选择判断是否计算数据集的mean
,median
或sd
?
答案 0 :(得分:5)
是的,一个选项是将函数传递给option
。 E.g。
mf <- function(data, option) {
option <- match.fun(option)
option(data)
}
set.seed(42)
dat <- rnorm(10)
mf(dat, option = mean)
给出了:
> set.seed(42)
> dat <- rnorm(10)
> mean(dat)
[1] 0.5472968
> mf(dat, option = mean)
[1] 0.5472968
> sd(dat)
[1] 0.8354488
> mf(dat, option = sd)
[1] 0.8354488
match.fun()
是匹配可用函数的标准R方式。在示例中,我传递函数本身,但match.fun()
允许其他方式引用函数,例如作为字符串:
> mf(dat, option = "mean")
[1] 0.5472968
match.fun()
返回一个可以用作任何其他函数的函数,因此option()
是一个与传递给option
参数的函数基本相同的函数,或者是函数在option
参数中命名。
我不清楚如何使用level
参数来忽略上述情况。
我应该补充一点,如果你想将任何参数传递给应用函数,那么你将要在函数定义中使用...
,例如:
mf <- function(data, option, ...) {
option <- match.fun(option)
option(data, ...)
}
因此我们可以做这样的事情
set.seed(42)
dat2 <- rnorm(10)
dat2[4] <- NA
mean(dat2)
mean(dat2, na.rm = TRUE)
mf(dat2, mean, na.rm = TRUE)
最后三行给出
> mean(dat2)
[1] NA
> mean(dat2, na.rm = TRUE)
[1] 0.5377895
> mf(dat2, mean, na.rm = TRUE)
[1] 0.5377895
答案 1 :(得分:4)
R中的“数据集”通常意味着数据帧并且没有median.data.frame,因此您需要同时使用lapply和do.call,这有一个问题:
df <- data.frame(x=rnorm(10), y=rnorm(10))
mf = function(data, option="mean") {lapply( data,
function(col) do.call(option, list(col))) }
mf(df)
#-------------
$x
[1] 0.01646814
$y
[1] 0.5388518
你没有说明应该做什么“级别”,所以我把它排除在等式之外,
> mf(df, sd)
$x
[1] 1.169847
$y
[1] 0.8907117