如何基于某一行组合/汇总数据?

时间:2017-11-04 14:58:48

标签: r

我目前有一张NFL球员统计数据表。 A列是玩家位置,B列是玩家姓名,C列是该周的玩家预计排名,D列是他们在那一周获得的幻想点数。像这样......

pos <- c("QB", "QB", "QB", "RB", "RB")
name <- c("Tom Brady", "Matt Ryan", "Aaron Rodgers", "Leveon Bell", "Devonta Freeman")
proj <- c(20.5, 18.5, 21.3, 22.5, 16.5)
actual <-c (15, 21.4, 19.0, 15.1, 12.4)
rawdata <- data.frame(pos, name, proj, actual)

由于到目前为止有8个星期,每个玩家有8行数据(每周1个)。我如何巩固这一点,以便我可以获得任何给定个体的平均预测和实际数据?例如:我想获得Matt Ryan(B栏)的平均投影(C栏)和平均实际数据(D栏)

奖励:如果我想获得任何给定位置的平均投影(C列)和平均实际数据(D列)怎么办? (A栏)

谢谢!

1 个答案:

答案 0 :(得分:-1)

使用dplyr / tidyverse,您将按如下方式接近第一项任务:

rawdata %>%
group_by(name) %>%
summarize(meanProjection = mean(proj),
          meanActual = mean(actual)) -> summarizedDataByName

第二个任务获得

rawdata %>%
group_by(pos) %>%
summarize(meanProjection = mean(proj),
          meanActual = mean(actual)) -> summarizedDataByPosition