我需要在scikit-learn中使用Imputer()
用该月的平均值填充缺失的温度值。
首先,我根据月份将数据帧拆分为组。然后我调用了imputer函数来计算该组的平均值并填写缺失值。
这是我写的代码,但它没有用:
def impute_missing (data_1_group):
imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
imp.fit(data_1_group)
data_1_group=imp.transform(data_1_group['datetime'])
return(data_1_group)
for data_1_group in data_1.groupby(pd.TimeGrouper("M")):
impute_missing(data_1_group)
有什么建议吗?
答案 0 :(得分:1)
尝试这个小小的改变
imp=imp.fit(data_1_group['datetime'])
data_1_group=imp.transform(data_1_group['datetime'])
虽然我是新手自我嘲笑,但我推荐的解决方案对我有用。这是因为
1)imp对象需要覆盖以适应,如第一行
2)它需要适合并归因于相同的数据集,在这种情况下似乎是data_1_group [' datetime']
我希望这会有所帮助