通过执行df.groupby('acc_count',as_index = False)['avg_spd']。median()
我知道了
acc_count avg_spd
0 20.94
1 24.42
2 26.035
3 33.27
4 33.46
5 36.07
6 35.03
7 33.49
8 71.85
在我的数据框中,avg_spd列中的值为空。我希望使用基于acc_count的avg_spd的上述值进行估算。例如,其中acc_count = 0和avg_spd为null的行,我需要将null替换为20.940
如何在熊猫中做到这一点?
答案 0 :(得分:0)
您可以创建一个acc_count字典作为键,如果avg_spd为 null ,则该值应为要放置的整数。
例如
dict = {0 : 20.940, 1 : 20.00 ,...}
然后可以使用以下逻辑,
df_new = df.groupby('acc_count', as_index=False)['avg_spd'].median()
df_new['avg_spd'].fillna(dict[df_new['acc_count']], inplace=True)