我有以下df
df2 = pd.DataFrame(
{ 'book' : [1, 1, 2, 2, 3, 3, 3, 3, 4, 4, 4],
'year' : [2017, 2018, 2016, 2017, 2016, 2017, 2017, 2018, 2017, 2017, 2018],
'cost' : [10, 20, 15, 25, 32, 52, 52, 42, 60, 50, 80],
'revenue' : [17.7, 35.4, 26.55, 44.25, 56.64, 92.04, 92.04, 74.34, 106.2, 105.4, 141.6]})
我想提取(book, year)
的唯一行,并为每条记录获取最低的revenue
。我也想保留所有行。
目前,我有df2.groupby(['book', 'year'])['revenue'].min().reset_index()
,但是它只有3列。不知道如何从这里继续。