我想计算一列的总和,但是按R中的其他列进行分类

时间:2017-08-25 06:19:20

标签: r

我有一个巨大的调查csv文件,我在Rstudio中导入。这是一个示例数据

User 1  User 2  Duration
5       2       7-11 months
5       5       Less than 1 month
5       5       4-6 months
5       5       4-6 months
5       4       4-6 months
5       5       2 years
4       6       1 year
4       4       4-6 months
4       8       7-11 months
4       4       2 years
3       3       Less than 1 month
3       3       7-11 months
3       3       1-3 months

我想计算user1的总和,用持续时间过滤,比如4-6 months

直到现在我已经使用过:

df %>% group_by(Duration) %>% summarise(count=n_distinct(User1)) %>% 
  +     filter(Duration=="4-6 months")

但它没有返回正确的值。请建议我解决方案。

1 个答案:

答案 0 :(得分:1)

您的列名可能不正确:

df %>%
 group_by(Duration) %>%
 summarise(sum_user1 = sum(`User 1`, na.rm = TRUE)) %>%
 filter(Duration=="4-6 months")