sklearn中的数据重塑(线性回归)

时间:2018-10-17 13:02:58

标签: anaconda linear-regression

输入代码:

data = pd.read_csv('test.csv')
data.head()

data['Density'] = data['Flow [Veh/h]'] / data['Speed [km/h]']
data = data.replace(np.nan, 1)

X = data['Density']
y = data['Speed [km/h]']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.4, random_state=101)

from sklearn.linear_model import LinearRegression
lm = LinearRegression()
lm.fit(X_train,y_train) #HERE I GOT AN ERROR

如果数据具有单个特征,则使用array.reshape(-1,1)来重塑数据;如果包含单个样本,则使用array.reshape(1,-1)来重塑数据。

2 个答案:

答案 0 :(得分:0)

您可以尝试如下更改变量X:

  

X = data ['Density']。values.reshape((-1,1))

我遇到了同样的错误,我的功能集只有一个变量。上面的更改为我解决了这个问题。

答案 1 :(得分:0)

在获取参数时尝试使用 [[]]

X = data[['Density']]