我正在使用事件数据集,并需要通过根据特定条件对特定变量求和来创建新df。
例如,假设我有一个在一个县销售的所有汽车的数据集,其中包括经销商的名称,汽车销售月份,汽车销售年份以及过去销售的汽车数量< em> n 年。我想创建一个新的df,其中每一行将显示特定经销商在年级销售的汽车数量。
换句话说,我想从这样的事情出发:
Dealership Month Year # of Cars
Bobs April 2016 12
Toms March 2016 8
Bobs July 2016 20
Toms June 2016 4
...
要
Dealership Month Year # of Cars
Bobs ? 2016 32
Toms ? 2016 12
...
我不确定这是否会给我一个错误,因为月份数据(或更大数据集中的其他列)会有所不同。我只是不需要这些信息。
有人可以帮忙吗?非常感谢。