Question

我有一个巨大的调查csv文件，我在Rstudio中导入。这是一个示例数据

User 1  User 2  Duration
5       2       7-11 months
5       5       Less than 1 month
5       5       4-6 months
5       5       4-6 months
5       4       4-6 months
5       5       2 years
4       6       1 year
4       4       4-6 months
4       8       7-11 months
4       4       2 years
3       3       Less than 1 month
3       3       7-11 months
3       3       1-3 months

我想计算user1的总和，用持续时间过滤，比如4-6 months。

直到现在我已经使用过：

df %>% group_by(Duration) %>% summarise(count=n_distinct(User1)) %>% 
  +     filter(Duration=="4-6 months")

但它没有返回正确的值。请建议我解决方案。

Answer 1

您的列名可能不正确：

df %>%
 group_by(Duration) %>%
 summarise(sum_user1 = sum(`User 1`, na.rm = TRUE)) %>%
 filter(Duration=="4-6 months")

我想计算一列的总和，但是按R中的其他列进行分类

1 个答案: