从数据框聚合

时间:2016-10-27 14:51:36

标签: r

我在R中有以下格式的数据框:

           City     Province   Poupulation
1       Bandung     JABAR       500,000
2      Surabaya     JATIM       600,000
3        Malang     JATIM       350,000
4         Bogor     JABAR       400,000
5      Semarang     JATENG      550,000
6       Cirebon     JABAR       300,000
7        Madiun     JATIM       200,000
8          Solo     JATENG      275,000
9         Tegal     JATENG      290,000

仅在JATENG省计算城市总人口的必要代码是什么?

1 个答案:

答案 0 :(得分:0)

以下是dplyr解决方案:

library(dplyr)
df %>% 
  group_by(Province) %>% 
    summarise(sum(Poupulation))

#  Province      sum
#    <fctr>    <dbl>
#1    JABAR   700000
#2   JATENG  1115000
#3    JATIM  1150000

如果您只对JATENG省感兴趣,那么这将完成这项工作:

df %>% 
  filter(Province == "JATENG") %>% 
    summarise(sum = sum(Poupulation))
#      sum
#1 1115000

也许您必须将summarise功能更改为summarise(sum = sum(as.numeric(Poupulation)))