我有一个数据框,其中包含三个项目和一个不同时间段的频率列,如下所示:
Col1 Col2 Col3 FREQUENCY INTERVAL
A item1 CLASS1 4 1
A item2 CLASS2 10 1
B item2 CLASS1 5 1
B item3 CLASS3 2 1
A item1 CLASS1 8 2
C item4 CLASS2 9 2
B item2 CLASS1 3 3
C item4 CLASS2 7 3
现在我想汇总前三列的频率,我试过了:df<-%>% count(col1,col2,col3,sort =TRUE)
但它在这种情况下不起作用。
预期结果是:
Col1 Col2 Col3 TOTAL_FREQUENCY
A item1 CLASS1 12
A item2 CLASS2 10
B item2 CLASS1 8
B item3 CLASS3 2
C item4 CLASS2 16
任何建议?
答案 0 :(得分:4)
使用google-services.json
的解决方案。我们还可以将googler-services.json
替换为dplyr
。 group_by_at(vars(starts_with("Col")))
函数用于计算出现次数。在这种情况下,我们需要group_by(Col1, Col2, Col3)
函数count
。
sum
数据强>
summarise