如何用dict pandas python替换分组的数据帧

时间:2017-10-01 17:23:31

标签: python pandas replace pivot-table pandas-groupby

我有一个数据框:

date | brand | red | blue | green
---------------------------------
2017 | BMW   |  2  |  1   |   0
     |  GM   |  0  |  1   |   0
2018 | BMW   |  0  |  0   |   1
     |  GM   |  1  |  2   |   0

这是以下行的结果:

pd.pivot_table(df.reset_index(),index=['date','brand'],columns='color',values='index',aggfunc='count').fillna(0)

应用于此初始DataFrame:

date | brand | color
--------------------
2017 | BMW   | red
2017 | GM    | blue
2017 | BMW   | blue
2017 | BMW   | red
2018 | BMW   | green
2018 | GM    | blue
2018 | GM    | blue
2018 | GM    | red

是否有可能以某种方式用字典替换宝马,GM在分组数据框中的条目,让我们说

di = {'BMW': 1, 'GM': 2}

我尝试过简单的df.replace({'brand': di}),但看起来品牌列不在数据框中,尽管我可以看到它。

1 个答案:

答案 0 :(得分:1)

MultiIndex需要rename替换di的值:

df = df.rename(di)
#same as
#df = df.rename(index=di)
print (df)
color       blue  green  red
date brand                  
2017 1       1.0    0.0  2.0
     2       1.0    0.0  0.0
2018 1       0.0    1.0  0.0
     2       2.0    0.0  1.0

当您将该字典传递给rename时,如果该函数遇到key,它将被value替换。