我是ML的新手。试用线性回归并面对以下错误。请帮我解决。 这是我的代码:
x=dataset.iloc[:,1:-1].values
y=dataset.iloc[:,-1].values
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
x_train,y_train,x_test,y_test=train_test_split(x,y,test_size=0.2)
regressor=LinearRegression()
regressor.fit(x_train,y_train)
y_pred=regressor.predict(x_test)
x.shape为[199,2],y.shape为[199,]。 执行代码后,我得到以下错误: ValueError:发现输入变量的样本数不一致:[159,40]
答案 0 :(得分:2)
从train_test_split
拆分的顺序看起来不正确。应该是:
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2)