我正在尝试使用dplyr计算按性别分组的第5列和第6列组合中的9s 和 10s的数量。我希望结果看起来像这样:
所需结果
代码是什么?我当前的代码不起作用:
Data %>% group_by(Gender) %>% sum(c([5,6]) == 9 | c([5,6]) == 10)
答案 0 :(得分:0)
dplyr
使用列名,而不是数字。将c([5, 6])
替换为c(name_of_fifth_column, name_of_sixth_column)
。 (而且,在所有情况下,列号都必须是 of 。[5, 6]
是语法错误。df[5, 6]
是df
的第五行,第六列df[c(5, 6)]
是df
的第五和第六列。并将其放在summarize()
中。
这应该有效:
Data %>%
group_by(Gender) %>%
summarize(Number_of_9s_and_10s = sum(c(name_of_fifth_column, name_of_sixth_column) %in% c(9, 10)))
如果这不起作用,请共享一些示例数据。