找到样本数量不一致的输入变量:[159,40]

时间:2018-12-24 06:30:32

标签: python-3.x machine-learning

我是ML的新手。试用线性回归并面对以下错误。请帮我解决。 这是我的代码:

  x=dataset.iloc[:,1:-1].values
y=dataset.iloc[:,-1].values
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
x_train,y_train,x_test,y_test=train_test_split(x,y,test_size=0.2)
regressor=LinearRegression()
regressor.fit(x_train,y_train)
y_pred=regressor.predict(x_test)

x.shape为[199,2],y.shape为[199,]。 执行代码后,我得到以下错误: ValueError:发现输入变量的样本数不一致:[159,40]

1 个答案:

答案 0 :(得分:2)

train_test_split拆分的顺序看起来不正确。应该是:

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2)