如果将onehotencoder应用于训练数据,如何通过测试数据以获得模型预测

时间:2019-03-22 05:32:35

标签: python-3.x machine-learning scikit-learn one-hot-encoding

我正在使用Sklearn.preprocessing预处理(onehotencoder)分类数据。

onehotencoder = OneHotEncoder()
pre_loc_data1 = onehotencoder.fit_transform(pre_loc_data1.astype(str)).toarray()
print(pre_loc_data1)

X_train, X_test, y_train, y_test = train_test_split(pre_loc_data1, pre_loc_target, test_size=0.2)

此处X列现在是编码数据。 如果我将y_train数据提供给模型进行预测,则效果很好。 因为它也是编码数据。 但我想使用个人记录作为输入来进行建模,以进行预测而不进行如下编码

(clf.predict(['Hyderabad / Secunderabad','0 Year(s) 8 Month(s)','android','java']))

如何提供此类数据作为模型输入以进行测试。

谢谢!

1 个答案:

答案 0 :(得分:1)

您需要将onehotencoder应用于输入(假设clf是受过训练的模型):

clf.predict(onehotencoder.transform([['Hyderabad / Secunderabad','0 Year(s) 8 Month(s)','android','java']]))