熊猫中的数据预处理

时间:2020-03-01 11:49:27

标签: python pandas dataframe data-science data-analysis

我想知道,该代码有什么问题,因为null值未填充我提供的值。我试图用每个团队加入的DateTime的平均值来填充nan。

df['Joined'] = pd.to_numeric(df['Joined'])
mean_joined_data = pd.pivot_table(df, values='Joined', index=['Club'], aggfunc=np.mean)
mean_joined_data = mean_joined_data.reset_index()

df['Joined'] = df.Joined.fillna(mean_joined_data.Joined, axis=0)
df['Joined'] = pd.to_datetime(df['Joined'])
df['Joined'].isnull().sum()```

1 个答案:

答案 0 :(得分:0)

并非所有的Nan都一样。 math.isnan np.isnan和pd.isna不等效。您的Nans是否有可能采用以下其中一种形式?