用groupby平均值替换熊猫数据框的空值

时间:2020-10-04 20:58:52

标签: python pandas dataframe jupyter-notebook fillna

我有一个包含以下数据的数据框:

df

我想用每个国家的平均值代替每个国家的空值。

例如 我用以下代码计算了平均值:

df2=df.groupby('country').mean()

mean

我必须用df2中存在的相应平均值替换df中的空值。 如果平均值为NaN,则保留Nan,否则为该值。

我尝试使用以下代码,但失败了: 1.输出仍然具有NaN值:

Output still has NaN values

2。

df['retail'] = df['retail'].replace('',df.groupby('country').mean())

enter image description here

1 个答案:

答案 0 :(得分:0)

要将空值替换为列的平均值,您应该执行以下操作:

 df['transit_stations'] = df['transit_stations'].fillna(df2.groupby('country')['transit_stations'].transform('mean'))