我对熊猫很新,我试着解决以下问题。 我的数据库看起来像这样:
我需要基本找出谁在2017年和2018年之间销售最多(两个日期之间的最大变化以及哪种类型的水果)
抱歉,如果这是一个愚蠢的问题,但我真的无法使用groupby或pivot找到一个简单的解决方案。谢谢!
答案 0 :(得分:0)
pd.pivot_table
是个不错的选择:
dfp = df.pivot_table(index=[ 'country', 'fruits'], columns=['date'],
values='kgsold', aggfunc=np.sum, fill_value=0)
# date 2017 2018
# country fruits
# germany apples 1 2
# figs 0 3
# pears 5 1
# italy apples 10 5
# pears 0 13
然后,您可以根据您的要求查询数据透视表。