使用Sk-learn线性回归对具有NaN的Pandas Predict Column

时间:2019-07-19 14:05:54

标签: python pandas dataframe scikit-learn

我有一个带有单个X列和一些NaN值的pandas DataFrame。我的df格式如下:

Index X
0     12
1     NaN
2     3
3     NaN
...   ...

我还训练了sklearn线性回归模型r。我想使用r来预测新列Y。但是,我遇到了这个错误: 当我只是尝试预测整个列时,ValueError: Input contains NaN , infinity or a value too large for dtype('float32')。在X也没有数据的情况下,如何创建具有Y值的Nan

我可以使用此代码r.predict(np.array(df['X'][np.logical_not(np.isnan(df['X']))]).reshape(-1,1))对存在的X个数据点进行预测,但是我不知道如何将这些预测合并回我的原始DataFrame中。我想有一种更简单的方式我会丢失。

0 个答案:

没有答案