根据列值合并行-总和一些列,最多合并其他

时间:2019-11-21 13:39:30

标签: merge group-by sum max

我想基于3列中的值对观察结果进行分组。我想总结一下其他一些列,对于其中一些我想采用最大值。例如,我有以下数据:

ID   year   city       #ofweeks productsold
 1    2018   Amsterdam      2          1 
 1    2019   Utrecht        5          1 
 1    2018   Amsterdam      1          0 
 1    2018   Amsterdam      1          1
 2    2019   Rotterdam      2          1 
 3    2019   Utrecht        2          0 
 3    2019   Utrecht        1          0

现在,我希望对ID,年份和城市的每种不同组合进行一次观察,并得出周数,然后从“ productsold”列中获取最大值。这应该导致以下结果:

ID   year   city       #ofweeks productsold
 1    2018   Amsterdam      4          1 
 1    2019   Utrecht        5          1 
 2    2019   Rotterdam      2          1 
 3    2019   Utrecht        3          0

我尝试使用group_by函数来执行此操作,但是没有得到正确的结果。我也希望这个输出变得像我可以使用的新数据集一样。希望有人可以帮助我。

注意:我总共有105列,所以当我不必手动完成每一列时,这会很好。

0 个答案:

没有答案