我有这样的数据集:
index1 index2 var1 var2
1 1 1 -3.1175877 -0.9776574
2 2 2 -0.6531706 -0.2230984
3 3 1 0.7909643 -0.1172342
4 4 2 -1.8195348 -0.1111046
5 5 1 -0.5132456 -1.1177841
6 6 2 -0.4288158 0.9268719
的变量多于我在此处设置的示例。 Index1和Index2是因子,我想在通过index1和index2对所有行进行分组后将均值函数应用于所有这些因子。因此,对于index1和index2的每个组合,我想要相应的变量均值。
我在StackOverflow上发现了很多类似的问题,使用了aggregate,tapply,by等等,但由于某些原因,这些非常相似的例子似乎对我没用。例如:
aggregate(vis, by=list(vis$index1, vis$index2), mean)
警告每一行抱怨"参数不是数字或逻辑:返回NA"结果数据框包含只有NA的index1和index2列。
任何帮助表示赞赏:)