使用分组变量计算多行的平均值

时间:2016-02-16 21:56:59

标签: r plyr psych

我正在尝试计算多个班级的总体平均值。目前,数据库采用长格式。我尝试选择第一个ID号(组变量1),然后选择我感兴趣的虚拟变量(词干= 1)类(分组变量2),然后计算收到的成绩的一个GPA均值(即词干GPA均值)在感兴趣的班级(干= 1)。

我附上了一个下面的数据库示例。总的来说,我正在尝试弄清楚如何为每个学生计算干GPA。

See example here

我曾尝试使用库(psych),describeBy(data,dataset $ id,dataset $ stem),但无济于事。有什么建议吗?

1 个答案:

答案 0 :(得分:1)

我更喜欢这些操作的dplyr包。试试,例如。

 df %>% group_by(class) %>% summarise(mean_class=mean(class))

例如,使用mtcars数据集:

 library(dplyr)
 mtcars %>% group_by(cyl) %>% summarise(mean_disp = mean(disp))

将根据分组变量disp为您提供cyl的所有方法。