保存用于为机器学习模型准备数据以供以后使用的功能

时间:2019-11-06 07:11:49

标签: python machine-learning pickle

我有一个机器学习模型,该模型已保存在pickle文件中。当我使用pickle文件获取其他数据的预测时,我需要为模型准备数据。如何在一个文件(例如泡菜文件)中保存用于数据准备的功能,以便仅导入文件并准备好数据?

所以,假设我需要执行以下操作以准备数据:

  1. 用nan替换inf值
  2. 删除不必要的列
  3. 将浮点类型更改为int
  4. 用数字(例如100)填充一列中的空单元格
  5. 删除数据中的所有nan值
  6. 要素和目标列分开

这是数据的解释:

  • 列:A,B,C,D,E,F,G
  • 列类型:str,float,float,float,int,int,int
  • 目标是列G,功能列是C,D,E,F

这是此代码:

import pandas as pd
import pickle

# get the saved model :
pickle_in = open("model_inPickle.pkl", "rb")
model = pickle.load(pickle_in)

# get the data :
df = pd.read_csv("aFile.csv")

# 1 :
df = df.replace([np.inf, -np.inf], np.nan)

# 2 :
df.drop(columns=['A', 'B'], inplace=True)

# 3 :
df['C'] = df['C'].astype(int)
df['D'] = df['D'].astype(int)

# 4 :
df['E'] = df['E'].fillna(value=100)

# 5 :
df.dropna(inplace=True)

# 6 :
X = df.drop(columns=['G'], axis=1)
Y = df['G']

Y_prediction = model.predict(X)

0 个答案:

没有答案