我一直试图找到一种方法来使用dplyr
遍历数据框中的列,这样我就可以对每一列执行操作。我不太明白如何引用每一列,但不对列名进行硬编码。
例如,这将使用apply表示列意味着: 申请(exampledf,2,函数(X){平均(X)})
请注意可以传递给函数的列本身x
的引用。在dplyr
中是否还有类似的内容?
我要做的具体任务(以及我的非工作dplyr代码)是创建一个包含column_mean(column_sd)
的新列:
library(dplyr)
set.seed(42)
exampledf<- as.data.frame(matrix(ceiling(runif(16,0,50)), ncol=4))
colnames(exampledf)<-c("c1","c2","c3","c4")
row.names(exampledf)<-c("r1","r2","r3","r4")
exampledf%>%group_by(exampledf$c1)%>%mutate(meanSD=paste(mean()+"("+sd()+")"))
目标
c1 c2 c3 c4 meanSD
r1 46 33 33 47 37.50(15.15)
r2 47 26 36 13 25.75(13.30)
r3 15 37 23 24 32.00(6.16)
r4 42 7 36 48 33.00(17.33)