假设我使用以下代码对数据集进行编码以创建机器学习模型:-
dataset = pd.read_csv('crop_production.csv')
from sklearn import preprocessing
le = preprocessing.LabelEncoder()
dataset = dataset.apply(le.fit_transform)
然后我将此模型另存为.pkl文件。
现在我要打电话
t = le_new.fit_transform(['Andaman and Nicobar Islands','NICOBARS',2000,'Kharif','Arecanut',1254])
# Predicting the Test set results
y_pred = regressor.predict([t])
如何在烧瓶中实现此目标,所以当我使用LabelEconder
时,其编码与le
相同
示例-
le
将t
编码为0 427 3 1 2 2026
所以le_new
也应该像这样编码,以便准确预测
答案 0 :(得分:0)
我们可以代替LabelEncoding做的是:-
数据集= pd.read_csv('crop_production.csv')
from sklearn import preprocessing
# Replace categorical data with one-hot encoded data
features_df = pd.get_dummies(dataset, columns=['State_Name', 'District_Name' , 'Season', 'Crop'])
X = features_df.iloc[:, :-1].values
y = features_df.iloc[:, -1].values