数据框处理:对变量的操作

时间:2019-05-01 15:32:44

标签: r dplyr plyr mutate

我有一个名为“ Bycountry”的数据框,如下所示:

国家诺德斯 1阿尔及利亚1 2法国2 3突尼斯3 4阿尔及利亚4 5 Allemagne 5 6法国6

我想对此数据帧进行统计:

  • 在“国家/地区”列中,国家摘要(无重复)
  • 在数字列中,按国家/地区求和

我已经安装了plyrdplyr软件包,所以我知道我必须使用mutate()summarise()group_by(),但我不知道哪个或如何。

   Otherbycountry <- data.frame(
          Countries = c("Algerie", "France", "Tunisie", "Algerie", 
          "Allemagne", "France"),
           Norders = c(1 , 2 , 3, 4, 5, 6))

当前结果是1x1的小标题,其中包含数字的总和。

1 个答案:

答案 0 :(得分:1)

代码

library(dplyr)
Otherbycountry %>% 
    # grouping by country
    group_by(Countries) %>% 
    # sum of Norders column (for each group) 
    summarise(Norders_sum = sum(Norders)) %>% 
    # ungroup
    ungroup()
  • 在R内键入?group_by?summarise?group_by,以获取有关功能的更多信息。
  • 阅读有关grouped summaries(Garrett Grolemund和Hadley Wickham的 R for Data Science的章节)的详细信息。

输出

# # A tibble: 4 x 2
# Countries Norders_sum
# <fct>           <dbl>
# 1 Algerie             5
# 2 Allemagne           5
# 3 France              8
# 4 Tunisie             3