我有一个带有单个X列和一些NaN值的pandas DataFrame。我的df格式如下:
Index X
0 12
1 NaN
2 3
3 NaN
... ...
我还训练了sklearn线性回归模型r
。我想使用r
来预测新列Y
。但是,我遇到了这个错误:
当我只是尝试预测整个列时,ValueError: Input contains
NaN , infinity or a value too large for dtype('float32')
。在X也没有数据的情况下,如何创建具有Y
值的Nan
?
我可以使用此代码r.predict(np.array(df['X'][np.logical_not(np.isnan(df['X']))]).reshape(-1,1))
对存在的X个数据点进行预测,但是我不知道如何将这些预测合并回我的原始DataFrame中。我想有一种更简单的方式我会丢失。