使用以列为参数的函数计算数据框或列表中的新列

时间:2018-11-10 13:32:38

标签: r

我正在尝试使用用户定义的函数来计算新列,该函数需要来自同一行的数据以及对所有行均有效的固定值:

myfunc <- function(ds,colname,val1,col1,col2){
  # content of new column <colname> should be computed from:
  ds[colname] = val1 + ds[col1] * ds[col2] #   for each row of ds
  return(ds)
}

v1 = 2
data(mtcars) 
mt = head(mtcars) 
mt
                   mpg cyl disp  hp drat    wt  qsec vs am gear 

carb
Mazda RX4         21.0   6  160 110 3.90 2.620 16.46  0  1    4    4
Mazda RX4 Wag     21.0   6  160 110 3.90 2.875 17.02  0  1    4    4
Datsun 710        22.8   4  108  93 3.85 2.320 18.61  1  1    4    1
Hornet 4 Drive    21.4   6  258 110 3.08 3.215 19.44  1  0    3    1
Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2
Valiant           18.1   6  225 105 2.76 3.460 20.22  1  0    3    1
apply(mt,'newcol',v1,mt$wt,mt$qsec)
mt

我想在mt $ newcol的第一行中看到的是:2 + 2.620 * 16.46(-> 45.12),所有其他行都类似。

那么,如何将固定值(v1)和每行中的两个值发送到函数中,并将返回值存储在该行的新列中?

谢谢

1 个答案:

答案 0 :(得分:1)

dplyr方法:

library(dplyr)

data(mtcars) 

myfunc <- function(ds, new_column, val1, col1, col2){

  name <- rownames(ds)
  ds <- ds %>% 
    mutate(!!as.name(new_column) := val1 + !!as.name(col1) + !!as.name(col2),
           car_name = name) %>% 
    select(car_name, mpg:!!as.name(new_column))

  return(ds)

}

head(
  myfunc(ds = mtcars,
         new_column = "new_column",
         val1 = 2, 
         col1 = "hp", 
         col2 = "vs")
)

输出

           car_name  mpg cyl disp  hp drat    wt  qsec vs am gear carb new_column
1         Mazda RX4 21.0   6  160 110 3.90 2.620 16.46  0  1    4    4        112
2     Mazda RX4 Wag 21.0   6  160 110 3.90 2.875 17.02  0  1    4    4        112
3        Datsun 710 22.8   4  108  93 3.85 2.320 18.61  1  1    4    1         96
4    Hornet 4 Drive 21.4   6  258 110 3.08 3.215 19.44  1  0    3    1        113
5 Hornet Sportabout 18.7   8  360 175 3.15 3.440 17.02  0  0    3    2        177
6           Valiant 18.1   6  225 105 2.76 3.460 20.22  1  0    3    1        108