Question

我正在尝试使用dplyr计算按性别分组的第5列和第6列组合中的9s 和 10s的数量。我希望结果看起来像这样：

所需结果

代码是什么？我当前的代码不起作用：

Data %>% group_by(Gender) %>% sum(c([5,6]) == 9 | c([5,6]) == 10)

Answer 1

dplyr使用列名，而不是数字。将c([5, 6])替换为c(name_of_fifth_column, name_of_sixth_column)。（而且，在所有情况下，列号都必须是 of 。[5, 6]是语法错误。df[5, 6]是df的第五行，第六列df[c(5, 6)]是df的第五和第六列。并将其放在summarize()中。

这应该有效：

Data %>% 
  group_by(Gender) %>% 
  summarize(Number_of_9s_and_10s = sum(c(name_of_fifth_column, name_of_sixth_column) %in% c(9, 10)))

如果这不起作用，请共享一些示例数据。

如何按组计算组合列中的值数

1 个答案: