如何用LabelEncode输入与.pkl文件相同的内容?

时间:2018-10-15 20:49:34

标签: python scikit-learn

假设我使用以下代码对数据集进行编码以创建机器学习模型:-

dataset = pd.read_csv('crop_production.csv')
from sklearn import preprocessing
le = preprocessing.LabelEncoder()
dataset = dataset.apply(le.fit_transform)

然后我将此模型另存为.pkl文件。

现在我要打电话

t = le_new.fit_transform(['Andaman and Nicobar Islands','NICOBARS',2000,'Kharif','Arecanut',1254])
# Predicting the Test set results
y_pred = regressor.predict([t])

如何在烧瓶中实现此目标,所以当我使用LabelEconder时,其编码与le相同

示例-

let编码为0 427 3 1 2 2026

所以le_new也应该像这样编码,以便准确预测

1 个答案:

答案 0 :(得分:0)

我们可以代替LabelEncoding做的是:-

数据集= pd.read_csv('crop_production.csv')

from sklearn import preprocessing

# Replace categorical data with one-hot encoded data
features_df = pd.get_dummies(dataset, columns=['State_Name', 'District_Name' , 'Season', 'Crop'])
X = features_df.iloc[:, :-1].values
y = features_df.iloc[:, -1].values