尺寸在线性回归中不匹配

时间:2020-01-09 13:52:37

标签: python scikit-learn linear-regression

我正在尝试一个简单的线性回归模型,但不知道为什么会出现这样的错误:

这是我的代码:

from sklearn import linear_model
regr = linear_model.LinearRegression()
regr.fit(X, Y)

会产生以下错误:

ValueError: Found input variables with inconsistent numbers of samples: [1518, 15]

X和Y的形状是:

X.shape, Y.shape
((1518, 1), (15, 1))

我试图从X中预测这些Y,但是我的尺寸并不相同;我该如何克服这个问题?

谢谢

1 个答案:

答案 0 :(得分:1)

您似乎错误地分割了特征和解释变量。

根据您所写的内容,您有Thread个样本和15个特征,其中之一是结果变量。

如果是这种情况,则为Y输入向量,为X输入矩阵应采用以下形状:

N=1518

假设给定一个X.shape = (1518,14) Y.shape = (1518,1) ,其特征名称为pd.dataframe,因变量Y为F1...F15,则可以按以下方式拆分变量:

F3

注意:如果当前使用的是numpy数组,则可以使用以下方法轻松地将其包装在数据框中:

Y = df['F3']
X = df.drop('F3', axis=1)