在python中缺少价值估算

时间:2019-04-29 11:58:49

标签: python imputation targetnullvalue

通过执行df.groupby('acc_count',as_index = False)['avg_spd']。median()

我知道了

acc_count          avg_spd
        0           20.94
        1           24.42
        2           26.035
        3           33.27
        4           33.46
        5           36.07
        6           35.03
        7           33.49
        8           71.85

在我的数据框中,avg_spd列中的值为空。我希望使用基于acc_count的avg_spd的上述值进行估算。例如,其中acc_count = 0和avg_spd为null的行,我需要将null替换为20.940

如何在熊猫中做到这一点?

1 个答案:

答案 0 :(得分:0)

您可以创建一个acc_count字典作为键,如果avg_spd为 null ,则该值应为要放置的整数。

例如

dict = {0 : 20.940, 1 : 20.00 ,...}

然后可以使用以下逻辑,

df_new = df.groupby('acc_count', as_index=False)['avg_spd'].median()
df_new['avg_spd'].fillna(dict[df_new['acc_count']], inplace=True)