我有一个机器学习模型,该模型已保存在pickle文件中。当我使用pickle文件获取其他数据的预测时,我需要为模型准备数据。如何在一个文件(例如泡菜文件)中保存用于数据准备的功能,以便仅导入文件并准备好数据?
所以,假设我需要执行以下操作以准备数据:
这是数据的解释:
A,B,C,D,E,F,G
str,float,float,float,int,int,int
G
,功能列是C,D,E,F
这是此代码:
import pandas as pd
import pickle
# get the saved model :
pickle_in = open("model_inPickle.pkl", "rb")
model = pickle.load(pickle_in)
# get the data :
df = pd.read_csv("aFile.csv")
# 1 :
df = df.replace([np.inf, -np.inf], np.nan)
# 2 :
df.drop(columns=['A', 'B'], inplace=True)
# 3 :
df['C'] = df['C'].astype(int)
df['D'] = df['D'].astype(int)
# 4 :
df['E'] = df['E'].fillna(value=100)
# 5 :
df.dropna(inplace=True)
# 6 :
X = df.drop(columns=['G'], axis=1)
Y = df['G']
Y_prediction = model.predict(X)