Question

我正在尝试计算多个班级的总体平均值。目前，数据库采用长格式。我尝试选择第一个ID号（组变量1），然后选择我感兴趣的虚拟变量（词干= 1）类（分组变量2），然后计算收到的成绩的一个GPA均值（即词干GPA均值）在感兴趣的班级（干= 1）。

我附上了一个下面的数据库示例。总的来说，我正在尝试弄清楚如何为每个学生计算干GPA。

我曾尝试使用库（psych），describeBy（data，dataset $ id，dataset $ stem），但无济于事。有什么建议吗？

Answer 1

我更喜欢这些操作的dplyr包。试试，例如。

 df %>% group_by(class) %>% summarise(mean_class=mean(class))

例如，使用mtcars数据集：

 library(dplyr)
 mtcars %>% group_by(cyl) %>% summarise(mean_disp = mean(disp))

将根据分组变量disp为您提供cyl的所有方法。