显示R中的最高值和所有其他值的总和

时间:2018-02-26 07:03:20

标签: r sqldf

在sqldf中使用order by TOTAL desc后,我的结果是

NAME  TOTAL
 A     100
 E     85
 D     75
 C     55
 B     30
 F     25
 G     20
 I     15
 H     10

我想显示前5名(在这种情况下),其余的要总结为'其他': 像这样:

NAME   TOTAL
A       100
E       85
D       75
C       55
B       30
Others  70

我有办法使用R吗?

1 个答案:

答案 0 :(得分:1)

假设您的数据已经排序,一种方法如下。它非常冗长,所以我很想看到其他解决方案。

df = read.table(text='NAME  TOTAL
A     100
E     85
D     75
C     55
B     30
F     25
G     20
I     15
H     10',header=T,stringsAsFactors=F)

library(dplyr)
df %>% 
  mutate(NAME=ifelse(NAME %in% head(NAME,5),NAME,'other')) %>% 
  mutate(NAME=factor(NAME,levels=unique(NAME))) %>%
  group_by(NAME) %>% 
  summarize(TOTAL=sum(TOTAL))

输出:

# A tibble: 6 x 2
  NAME   TOTAL
  <fctr> <int>
1 A        100
2 E         85
3 D         75
4 C         55
5 B         30
6 other     70

希望这有帮助!