Question

我目前有一张NFL球员统计数据表。 A列是玩家位置，B列是玩家姓名，C列是该周的玩家预计排名，D列是他们在那一周获得的幻想点数。像这样......

pos <- c("QB", "QB", "QB", "RB", "RB")
name <- c("Tom Brady", "Matt Ryan", "Aaron Rodgers", "Leveon Bell", "Devonta Freeman")
proj <- c(20.5, 18.5, 21.3, 22.5, 16.5)
actual <-c (15, 21.4, 19.0, 15.1, 12.4)
rawdata <- data.frame(pos, name, proj, actual)

由于到目前为止有8个星期，每个玩家有8行数据（每周1个）。我如何巩固这一点，以便我可以获得任何给定个体的平均预测和实际数据？例如：我想获得Matt Ryan（B栏）的平均投影（C栏）和平均实际数据（D栏）

奖励：如果我想获得任何给定位置的平均投影（C列）和平均实际数据（D列）怎么办？（A栏）

谢谢！

Answer 1

使用dplyr / tidyverse，您将按如下方式接近第一项任务：

rawdata %>%
group_by(name) %>%
summarize(meanProjection = mean(proj),
          meanActual = mean(actual)) -> summarizedDataByName

第二个任务获得

rawdata %>%
group_by(pos) %>%
summarize(meanProjection = mean(proj),
          meanActual = mean(actual)) -> summarizedDataByPosition

如何基于某一行组合/汇总数据？

1 个答案: