Sklearn线性回归拟合输入顺序?外生变量优先吗?

时间:2019-06-28 14:27:08

标签: python scikit-learn statistics regression

参考页显示:

Parameters: 
X : array-like or sparse matrix, shape (n_samples, n_features)
Training data

y : array_like, shape (n_samples, n_targets)
Target values. Will be cast to X’s dtype if necessary

X是外生变量吗?我以为是这样,但是使用statsmodel OLS时,内源性首先出现,所以我想确认一下,因为它们产生不同的系数。

1 个答案:

答案 0 :(得分:0)

是的,是正确的,与statsmodel OLS模块相比,sklearn模块中输入外生变量和内生变量的顺序是相反的(sklearn中的其他模型也是如此)。

  

如果X =外生变量而Y =内生

在sklearn中,您将执行以下操作:

clf.fit(X,Y)

而在statsmodel中,您应该这样做:

clf.fit(Y,X)

clf是您要构建的模型。

希望这会有所帮助!