我已经使用X = X.fillna(X.mean())
来填写NaN
。但我仍然收到错误
" ValueError:找到样本数不一致的数组:[7 210]"
当我尝试我的train_test_split时。
我查看了我的X df,似乎仍然缺少值(空格)。
如何使用该列的平均值填充这些空格?
答案 0 :(得分:0)
您可以尝试类似这样的示例:
df = pd.DataFrame({'A': [1,2,3,4,5], 'B': [6,7,8,np.nan,10]})
A B
0 1 6.0
1 2 7.0
2 3 8.0
3 4 NaN
4 5 10.0
print(df.B.fillna(df['B'].mean()))
0 6.00
1 7.00
2 8.00
3 7.75
4 10.00
Name: B, dtype: float64