单一数据可通过具有多个分类特征的线性回归模型进行预测

时间:2018-11-02 10:24:21

标签: python scikit-learn prediction

我建立了线性回归模型来预测产品的销售数量, 就我而言,我有5个功能,其中4个是分类功能。

MONTH REGION INTERVENANT CONFIG WEIGHT SALES_NB

我使用了OneHotEncoder

from sklearn.preprocessing import OneHotEncoder
onehotencoder = OneHotEncoder(categorical_features = [0,1,2,3])
X = onehotencoder.fit_transform(X).toarray()
X = X [:, 1:]

(如果我错了,请纠正我)

我想知道如何格式化我的数据以将其传递给predict()。 实际上,如果我通过:

Xnew = np.array([[2,2,14895,614,0.1]])
ynew = regressor.predict(Xnew)

我收到此错误:

  

ValueError:形状(1,4)和(428,)不对齐:4(dim 1)!= 428(dim 0)

1 个答案:

答案 0 :(得分:1)

在将新样本传递给预测变量之前,尝试使用onehotencoder对新样本进行编码:

Xnew = np.array([[2,2,14895,614,0.1]])
Xnew_encoded = onehotencoder.transform(Xnew)
ynew = regressor.predict(Xnew_encoded)