这是我第一次在这里提问,因为我最近才开始与R合作,我仍在学习基础知识。我的问题是:
我有一个包含942个观测数据的数据框(每个主题12个),并希望以每个主题有一行的方式聚合数据,每个变量每个变量一个值。这是一个例子:
现:
Sno Var1 Var2
1 a b
1 c d
1 e f
2 g h
2 i j
2 k l
对于这样的事情(均值/和只是某种形式的摘要的例子):
Sno Var1 Var2
1 mean(Var1) sum(Var2)
2 mean(Var1) sum(Var2)
我不想在原始数据框中创建另一列,例如主题的平均值为12次,但是以上面显示的方式创建新表和/或数据框。我试图了解aggregate
,ddply
或者data.table
对数据的确切功能,但我仍然无法决定使用哪个函数。最终目标是计算与具有相同数量的主题的另一数据集的相关性。我为这个问题的模糊性道歉,但就R来说,我是一个完全新的人。