我正在尝试使用statsmodels.api
库来训练带有截距的线性回归模型(因为这样,我可以获得参数sgnificance的摘要)。
不幸的是,这种方法不起作用
X_train_2 = sm.add_constant(X_train)
因此,我尝试通过执行以下操作向我的X_train数据集中手动添加一个1 Costant向量:
const = pd.Series([1]*1460, name='const')
X_train_2 = pd.concat([const , X_train ] , axis=1)
model_sm_1 = sm.OLS(Y_train , X_train_2 ).fit()
但再次出现错误:
文件“ C:\ Users \ myname \ Anaconda3 \ lib \ site-packages \ statsmodels \ base \ data.py”,行_handle_constant中的133行 引发MissingDataError('exog包含inf或nans')
MissingDataError:exog包含inf或nans
我的问题是2:
1)我该如何解决此错误 2)是否存在另一个提供汇总表的线性回归库? (sklearn没有给我这个)