我有一个巨大的调查csv文件,我在Rstudio中导入。这是一个示例数据
User 1 User 2 Duration
5 2 7-11 months
5 5 Less than 1 month
5 5 4-6 months
5 5 4-6 months
5 4 4-6 months
5 5 2 years
4 6 1 year
4 4 4-6 months
4 8 7-11 months
4 4 2 years
3 3 Less than 1 month
3 3 7-11 months
3 3 1-3 months
我想计算user1
的总和,用持续时间过滤,比如4-6 months
。
直到现在我已经使用过:
df %>% group_by(Duration) %>% summarise(count=n_distinct(User1)) %>%
+ filter(Duration=="4-6 months")
但它没有返回正确的值。请建议我解决方案。
答案 0 :(得分:1)
您的列名可能不正确:
df %>%
group_by(Duration) %>%
summarise(sum_user1 = sum(`User 1`, na.rm = TRUE)) %>%
filter(Duration=="4-6 months")