我想将ML模型持久保存到本地计算机上。我已经按照https://stackoverflow.com/a/29291153/11543494的答案将ML模型存储在本地计算机中,但是当我从本地计算机加载持久化ML模型时,会出现Key Error。
我已经创建了可以预测URL类别的ML模型。现在,我想将ML模型与Web应用程序集成在一起,这就是为什么我使用Flask创建了API。
我已经在jupyter笔记本中测试了ML模型,现在我的代码与ML模型相关,我只想转储ML模型并在我的API中使用它。在jupyter笔记本中,我得到了正确的输出,但是当我在API代码中加载持久文件时,出现KeyError。我尝试使用pickle,joblib,但那里出现了MemoryError,我也尝试解决该问题,但是我无法解决该问题,所以我尝试使用Klepto。
Klepto代码
from klepto.archives import dir_archive
model = dir_archive('E:/Mayur/Sem 5/Python project/model_klepto',{'result':gs_clf},serialized=True, cached=False)
#gs_clf = gs_clf.fit(x_train, y_train) #RandomizedSearchCV
model.dump()
API代码
import numpy as np
from flask import Flask, request, jsonify, render_template
from klepto.archives import dir_archive
app = Flask(__name__)
demo = dir_archive(
'E:/Mayur/Sem 5/Python project/model_klepto', {}, serialized=True, cached=False)
demo.load()
@app.route('/')
def home():
return render_template('index.html')
@app.route('/predict', methods=['POST'])
def predict():
input = request.form.values()
final_feature = [np.array(input)]
prediction = demo['result'].predict([str(final_feature)])
return render_template('index.html', prediction_text=prediction)
if __name__ == "__main__":
app.run(debug=True)
当我运行API时,出现KeyError:“结果”。
如果我在jupyter笔记本中的代码下运行,我将获得正确的输出
demo = dir_archive(
'E:/Mayur/Sem 5/Python project/model_klepto', {}, serialized=True, cached=False)
demo.load()
demo
输出>
ir_archive('model_klepto', {'result': RandomizedSearchCV(cv='warn', error_score='raise-deprecating',
estimator=Pipeline(memory=None,
steps=[('vect',
CountVectorizer(analyzer='word',
binary=False,
decode_error='strict',
dtype=<class 'numpy.int64'>,
encoding='utf-8',
input='content',
lowercase=True,
max_df=1.0,
max_features=None,
min_df=1,
ngram_range=(1,
1),
preprocessor=None,
stop_words=None,
strip_accen...
sublinear_tf=False,
use_idf=True)),
('clf',
MultinomialNB(alpha=1.0,
class_prior=None,
fit_prior=True))],
verbose=False),
iid='warn', n_iter=5, n_jobs=None,
param_distributions={'clf__alpha': (0.01, 0.001),
'tfidf__use_idf': (True, False),
'vect__ngram_range': [(1, 1), (1, 2)]},
pre_dispatch='2*n_jobs', random_state=None, refit=True,
return_train_score=False, scoring=None, verbose=0)}, cached=False)
demo['result'].predict(['http://www.windows.com'])
输出> array(['Computers'],dtype =
这是堆栈跟踪的屏幕截图 Stack trace