我建立了线性回归模型来预测产品的销售数量, 就我而言,我有5个功能,其中4个是分类功能。
MONTH REGION INTERVENANT CONFIG WEIGHT SALES_NB
我使用了OneHotEncoder
from sklearn.preprocessing import OneHotEncoder
onehotencoder = OneHotEncoder(categorical_features = [0,1,2,3])
X = onehotencoder.fit_transform(X).toarray()
X = X [:, 1:]
(如果我错了,请纠正我)
我想知道如何格式化我的数据以将其传递给predict()。 实际上,如果我通过:
Xnew = np.array([[2,2,14895,614,0.1]])
ynew = regressor.predict(Xnew)
我收到此错误:
ValueError:形状(1,4)和(428,)不对齐:4(dim 1)!= 428(dim 0)
答案 0 :(得分:1)
在将新样本传递给预测变量之前,尝试使用onehotencoder
对新样本进行编码:
Xnew = np.array([[2,2,14895,614,0.1]])
Xnew_encoded = onehotencoder.transform(Xnew)
ynew = regressor.predict(Xnew_encoded)