我在R中有一个如下所示的数据框:
team id name
1 2335 Victor
1 379 Marc
1 4484 Newton
2 51 AZRIA
2 379 Marc
2 552 Steve
2 1674 Miu
2 1688 Moschi
编辑以使其更清晰:
答案 0 :(得分:1)
这将为每个团队提供一个单独的数据框:
split(df, df$team)
听起来您的id
和name
变量不会发生变化(即id
和name
基本相同。在这种情况下,要找到最常见的id
或name
,只需使用table
(可能是sort
- ed):
sort(table(df$id), decreasing=TRUE)
sort(table(df$name), decreasing=TRUE)
您可能还想要将两者结合起来:
sort(with(df, table(paste(id,name))),decreasing=TRUE)