所以让我更具体一点...... 我有一个
的数据集SOCCERTEAM -PLAYERS
BARCA - MESSI
BARCA - XAVI
-RM - CR
-RM - CR
-RM - PEPE
-RM -HIQUAIN 等(只是一个非数据集的例子)
作为专栏!!!
我想要回答这个问题: 的"我如何根据他们使用的球员数量来找到前5名球队" *球队可以多次使用球员,因此找不到因素水平是不可能的 *所以如果barca使用了15个玩家并且Rm使用了14个,那么BARCA就是第一个......
答案 0 :(得分:0)
library(dplyr)
df %>%
group_by(SOCCERTEAM) %>%
summarize(rank = n_distinct(PLAYERS)) %>%
top_n(5, wt = rank)