我正在尝试计算多个班级的总体平均值。目前,数据库采用长格式。我尝试选择第一个ID号(组变量1),然后选择我感兴趣的虚拟变量(词干= 1)类(分组变量2),然后计算收到的成绩的一个GPA均值(即词干GPA均值)在感兴趣的班级(干= 1)。
我附上了一个下面的数据库示例。总的来说,我正在尝试弄清楚如何为每个学生计算干GPA。
我曾尝试使用库(psych),describeBy(data,dataset $ id,dataset $ stem),但无济于事。有什么建议吗?
答案 0 :(得分:1)
我更喜欢这些操作的dplyr
包。试试,例如。
df %>% group_by(class) %>% summarise(mean_class=mean(class))
例如,使用mtcars
数据集:
library(dplyr)
mtcars %>% group_by(cyl) %>% summarise(mean_disp = mean(disp))
将根据分组变量disp
为您提供cyl
的所有方法。