我正在尝试使用基数R复制dplyr::mutate_at()
的结果。我对自己编写函数还很陌生,我想知道我提出的函数是否(a)合理,(b)如何做到我在函数内进行了cbind()
调用,还保留了diamonds
数据集中的所有变量。
首先进行dplyr::mutate_at()
通话:
require(tidyverse)
diamonds %>%
mutate_at(.funs = funs(relative = ./price), .vars = c("x", "y", "z"))
# A tibble: 53,940 x 13
#carat cut color clarity depth table price x y z x_relative y_relative z_relative
#<dbl> <ord> <ord> <ord> <dbl> <dbl> <int> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#1 0.23 Ideal E SI2 61.5 55 326 3.95 3.98 2.43 0.0121 0.0122 0.00745
#2 0.21 Premium E SI1 59.8 61 326 3.89 3.84 2.31 0.0119 0.0118 0.00709
#3 0.23 Good E VS1 56.9 65 327 4.05 4.07 2.31 0.0124 0.0124 0.00706
#4 0.290 Premium I VS2 62.4 58 334 4.2 4.23 2.63 0.0126 0.0127 0.00787
#5 0.31 Good J SI2 63.3 58 335 4.34 4.35 2.75 0.0130 0.0130 0.00821
#6 0.24 Very Good J VVS2 62.8 57 336 3.94 3.96 2.48 0.0117 0.0118 0.00738
#7 0.24 Very Good I VVS1 62.3 57 336 3.95 3.98 2.47 0.0118 0.0118 0.00735
#8 0.26 Very Good H SI1 61.9 55 337 4.07 4.11 2.53 0.0121 0.0122 0.00751
#9 0.22 Fair E VS2 65.1 61 337 3.87 3.78 2.49 0.0115 0.0112 0.00739
#10 0.23 Very Good H VS1 59.4 61 338 4 4.05 2.39 0.0118 0.0120 0.00707
# ... with 53,930 more rows
这是我想出的将结果复制到基数R中的功能:
rel_fun <- function(x, y){
out <- x / y
colnames(out) <- (paste(colnames(x), "relative", sep = "_"))
out
}
结果如下:
df_out <- rel_fun(diamonds[c("x", "y", "z")], diamonds$price)
df_out2 <- cbind(diamonds, df_out)
head(df_out2)
#carat cut color clarity depth table price x y z x_relative y_relative z_relative
#1 0.23 Ideal E SI2 61.5 55 326 3.95 3.98 2.43 0.01211656 0.01220859 0.007453988
#2 0.21 Premium E SI1 59.8 61 326 3.89 3.84 2.31 0.01193252 0.01177914 0.007085890
#3 0.23 Good E VS1 56.9 65 327 4.05 4.07 2.31 0.01238532 0.01244648 0.007064220
#4 0.29 Premium I VS2 62.4 58 334 4.20 4.23 2.63 0.01257485 0.01266467 0.007874251
#5 0.31 Good J SI2 63.3 58 335 4.34 4.35 2.75 0.01295522 0.01298507 0.008208955
#6 0.24 Very Good J VVS2 62.8 57 336 3.94 3.96 2.48 0.01172619 0.01178571 0.007380952
我会说一切正常,但是如上所述,如何在函数中包含diamonds
的同时保留cbind()
数据集的所有变量?
我尝试了以下操作,但由于没有在函数中添加变量,因此无法获取diamonds
数据集的其他变量。我只添加了计算所需的内容,即diamonds[c("x", "y", "z")]
。有没有一种方法可以在函数中添加一些东西,让我保留原始数据集的其他变量?
rel_fun <- function(x, y){
out <- x / y
colnames(out) <- (paste(colnames(x), "relative", sep = "_"))
out2 <- cbind(x, out)
out2
}
df_out3 <- rel_fun(diamonds[c("x", "y", "z")], diamonds$price)
head(df_out3)
# x y z x_relative y_relative z_relative
#1 3.95 3.98 2.43 0.01211656 0.01220859 0.007453988
#2 3.89 3.84 2.31 0.01193252 0.01177914 0.007085890
#3 4.05 4.07 2.31 0.01238532 0.01244648 0.007064220
#4 4.20 4.23 2.63 0.01257485 0.01266467 0.007874251
#5 4.34 4.35 2.75 0.01295522 0.01298507 0.008208955
#6 3.94 3.96 2.48 0.01172619 0.01178571 0.007380952
答案 0 :(得分:2)
管道运算符%>%
隐式传递数据帧diamonds
作为mutate_at()
的第一个参数。要模仿其行为,您需要对函数执行相同的操作。因为您要将整个数据帧传递给该函数,所以也可以仅将列名传递为x
:
rel_fun <- function(.data, x, y){
out <- .data[x] / y
colnames(out) <- (paste(x, "relative", sep = "_"))
out2 <- cbind(.data, out)
out2
}
rel_fun( diamonds, c("x", "y", "z"), diamonds$price ) # Works as desired