我有一个数据框,其中列为“月”和“销售”。对于每个月,“销售”列中都有多个值。我想对每个月的Sales列中的值求和,并希望在Months列中获得每个月的单个值。可以帮忙。
我尝试做一些groupby操作,然后执行Dataframe.sum()函数。但是我无法正确进行。 我是python的新手,很困惑该怎么做才能获得理想的结果。
import pandas as pd
rec = {'sales':[1,2,3,4,5,6,7,8,9,10, 11,12,13,14,15,16,17,18,19,20],
'month':[1,1,1,1,1,2,2,2,2,2,3,3,3,3,3,4,4,4,4,4]}
df = pd.DataFrame(rec)
months = df.groupby('month').groups # getting unique values of months
grp = df.groupby('month')
m1 = grp.get_group(1) #getting data for month 1 i.e. January
预期输出为:
sales month
0 15 1
1 40 2
2 65 3
3 90 4
以此类推