Question

假设我使用以下代码对数据集进行编码以创建机器学习模型：-

dataset = pd.read_csv('crop_production.csv')
from sklearn import preprocessing
le = preprocessing.LabelEncoder()
dataset = dataset.apply(le.fit_transform)

然后我将此模型另存为.pkl文件。

现在我要打电话

t = le_new.fit_transform(['Andaman and Nicobar Islands','NICOBARS',2000,'Kharif','Arecanut',1254])
# Predicting the Test set results
y_pred = regressor.predict([t])

如何在烧瓶中实现此目标，所以当我使用LabelEconder时，其编码与le相同

示例-

le将t编码为0 427 3 1 2 2026

所以le_new也应该像这样编码，以便准确预测

Answer 1

我们可以代替LabelEncoding做的是：-

数据集= pd.read_csv（'crop_production.csv'）

from sklearn import preprocessing

# Replace categorical data with one-hot encoded data
features_df = pd.get_dummies(dataset, columns=['State_Name', 'District_Name' , 'Season', 'Crop'])
X = features_df.iloc[:, :-1].values
y = features_df.iloc[:, -1].values

如何用LabelEncode输入与.pkl文件相同的内容？

1 个答案: