我有一个美式足球统计数据集,其中有一个玩家姓名列和一个他对该游戏的评分。我想找出哪个玩家的平均评分最高的数据集。如果不手动制作每个玩家的子组,我怎么能这样做呢?
答案 0 :(得分:3)
如果df是您的数据框:
df %>%
group_by(player_name) %>%
mutate(mean = mean(rank, na.rm = TRUE)) # to add new column
或summary(df, mean = mean(rank, na.rm = TRUE))
然后,您可以通过添加
按此平均排名来排列数据集arrange(df, desc(mean))
您可以在顶部获得具有此平均值最高值的排列数据集