如何拆分 - 应用 - 组合R中的几个变量/列

时间:2015-07-15 19:48:28

标签: r plyr split-apply-combine

我想按组对几个变量执行一个函数。

虚假数据;

df<-data.frame(rnorm(100,mean=10), 
               rnorm(100,mean=15),
               rnorm(100,mean=20),
               rep(letters[1:10],each=10)
               )
colnames(df)<-c("var1","var2","var3","group1")

在这种特殊情况下,我想用组来表示每个变量的中心。我想返回一个包含原始和居中变量的数据帧。

通常我会使用PLYR包;

library(plyr)    
ddply(df, "group1", transform, centered_var1= scale(var1, scale=FALSE))

但是,我无法成功循环此函数,或者想到另一种最小代码方式来执行此操作。

我对非PLYR解决方案持开放态度......我的主要标准是将代码保持在最低限度。

3 个答案:

答案 0 :(得分:3)

使用dplyr

library(dplyr)
df %>% group_by(group1) %>%
  mutate_each(funs(scale(., scale=F))) -> res

答案 1 :(得分:3)

colwise功能可能是您正在寻找的功能。

library("plyr")
ddply(df, .(group1), colwise(scale, scale = FALSE))

答案 2 :(得分:1)

这是你想要的吗?

ddply(df, "group1", transform, centered_var1= scale(var1, scale=FALSE),
      centered_var2 = scale(var2, scale=FALSE),
      centered_var3 = scale(var3, scale=FALSE))