我正在使用Sklearn.preprocessing预处理(onehotencoder)分类数据。
onehotencoder = OneHotEncoder()
pre_loc_data1 = onehotencoder.fit_transform(pre_loc_data1.astype(str)).toarray()
print(pre_loc_data1)
X_train, X_test, y_train, y_test = train_test_split(pre_loc_data1, pre_loc_target, test_size=0.2)
此处X列现在是编码数据。 如果我将y_train数据提供给模型进行预测,则效果很好。 因为它也是编码数据。 但我想使用个人记录作为输入来进行建模,以进行预测而不进行如下编码
(clf.predict(['Hyderabad / Secunderabad','0 Year(s) 8 Month(s)','android','java']))
如何提供此类数据作为模型输入以进行测试。
谢谢!
答案 0 :(得分:1)
您需要将onehotencoder
应用于输入(假设clf
是受过训练的模型):
clf.predict(onehotencoder.transform([['Hyderabad / Secunderabad','0 Year(s) 8 Month(s)','android','java']]))