我正在尝试一个简单的线性回归模型,但不知道为什么会出现这样的错误:
这是我的代码:
from sklearn import linear_model
regr = linear_model.LinearRegression()
regr.fit(X, Y)
会产生以下错误:
ValueError: Found input variables with inconsistent numbers of samples: [1518, 15]
X和Y的形状是:
X.shape, Y.shape
((1518, 1), (15, 1))
我试图从X中预测这些Y,但是我的尺寸并不相同;我该如何克服这个问题?
谢谢
答案 0 :(得分:1)
您似乎错误地分割了特征和解释变量。
根据您所写的内容,您有Thread
个样本和15个特征,其中之一是结果变量。
如果是这种情况,则为Y输入向量,为X输入矩阵应采用以下形状:
N=1518
假设给定一个X.shape = (1518,14)
Y.shape = (1518,1)
,其特征名称为pd.dataframe
,因变量Y为F1...F15
,则可以按以下方式拆分变量:
F3
注意:如果当前使用的是numpy数组,则可以使用以下方法轻松地将其包装在数据框中:
Y = df['F3']
X = df.drop('F3', axis=1)