我有一个如下数据框:请注意COL1
有重复的条目
COL1 COL2 COL3
10 hai 2
10 hai 3
10 pal 1
我希望输出如下所示:即COL1
应该单独使用唯一条目(10),COL2
应该包含其下的合并条目而不重复(hai pal),并且COL3
应包含条目总和(2 + 3 + 1 = 6)
输出:
COL1 COL2 COL3
10 hai pal 6
答案 0 :(得分:1)
也许我们需要按组聚合。将'data.frame'转换为'data.table'(setDT(df1
),按'COL1'分组,paste
'COL2'中的unique
元素组合在一起以及获取{ {COL3'的{1}}。
sum