我想按组对几个变量执行一个函数。
虚假数据;
df<-data.frame(rnorm(100,mean=10),
rnorm(100,mean=15),
rnorm(100,mean=20),
rep(letters[1:10],each=10)
)
colnames(df)<-c("var1","var2","var3","group1")
在这种特殊情况下,我想用组来表示每个变量的中心。我想返回一个包含原始和居中变量的数据帧。
通常我会使用PLYR包;
library(plyr)
ddply(df, "group1", transform, centered_var1= scale(var1, scale=FALSE))
但是,我无法成功循环此函数,或者想到另一种最小代码方式来执行此操作。
我对非PLYR解决方案持开放态度......我的主要标准是将代码保持在最低限度。
答案 0 :(得分:3)
使用dplyr
library(dplyr)
df %>% group_by(group1) %>%
mutate_each(funs(scale(., scale=F))) -> res
答案 1 :(得分:3)
colwise
功能可能是您正在寻找的功能。
library("plyr")
ddply(df, .(group1), colwise(scale, scale = FALSE))
答案 2 :(得分:1)
这是你想要的吗?
ddply(df, "group1", transform, centered_var1= scale(var1, scale=FALSE),
centered_var2 = scale(var2, scale=FALSE),
centered_var3 = scale(var3, scale=FALSE))