从本地计算机使用时,在Klepto中获取KeyError

时间:2019-10-23 07:57:28

标签: keyerror klepto

我想将ML模型持久保存到本地计算机上。我已经按照https://stackoverflow.com/a/29291153/11543494的答案将ML模型存储在本地计算机中,但是当我从本地计算机加载持久化ML模型时,会出现Key Error。

我已经创建了可以预测URL类别的ML模型。现在,我想将ML模型与Web应用程序集成在一起,这就是为什么我使用Flask创建了API。

我已经在jupyter笔记本中测试了ML模型,现在我的代码与ML模型相关,我只想转储ML模型并在我的API中使用它。在jupyter笔记本中,我得到了正确的输出,但是当我在API代码中加载持久文件时,出现KeyError。我尝试使用pickle,joblib,但那里出现了MemoryError,我也尝试解决该问题,但是我无法解决该问题,所以我尝试使用Klepto。

Klepto代码

from klepto.archives import dir_archive

model = dir_archive('E:/Mayur/Sem 5/Python project/model_klepto',{'result':gs_clf},serialized=True, cached=False)
#gs_clf = gs_clf.fit(x_train, y_train) #RandomizedSearchCV
model.dump()

API代码

import numpy as np
from flask import Flask, request, jsonify, render_template
from klepto.archives import dir_archive

app = Flask(__name__)

demo = dir_archive(
    'E:/Mayur/Sem 5/Python project/model_klepto', {}, serialized=True, cached=False)
demo.load()


@app.route('/')
def home():
    return render_template('index.html')


@app.route('/predict', methods=['POST'])
def predict():
    input = request.form.values()
    final_feature = [np.array(input)]
    prediction = demo['result'].predict([str(final_feature)])

    return render_template('index.html', prediction_text=prediction)


if __name__ == "__main__":
    app.run(debug=True)

当我运行API时,出现KeyError:“结果”。

如果我在jupyter笔记本中的代码下运行,我将获得正确的输出

demo = dir_archive(
    'E:/Mayur/Sem 5/Python project/model_klepto', {}, serialized=True, cached=False)
demo.load()
demo

输出>

ir_archive('model_klepto', {'result': RandomizedSearchCV(cv='warn', error_score='raise-deprecating',
                   estimator=Pipeline(memory=None,
                                      steps=[('vect',
                                              CountVectorizer(analyzer='word',
                                                              binary=False,
                                                              decode_error='strict',
                                                              dtype=<class 'numpy.int64'>,
                                                              encoding='utf-8',
                                                              input='content',
                                                              lowercase=True,
                                                              max_df=1.0,
                                                              max_features=None,
                                                              min_df=1,
                                                              ngram_range=(1,
                                                                           1),
                                                              preprocessor=None,
                                                              stop_words=None,
                                                              strip_accen...
                                                               sublinear_tf=False,
                                                               use_idf=True)),
                                             ('clf',
                                              MultinomialNB(alpha=1.0,
                                                            class_prior=None,
                                                            fit_prior=True))],
                                      verbose=False),
                   iid='warn', n_iter=5, n_jobs=None,
                   param_distributions={'clf__alpha': (0.01, 0.001),
                                        'tfidf__use_idf': (True, False),
                                        'vect__ngram_range': [(1, 1), (1, 2)]},
                   pre_dispatch='2*n_jobs', random_state=None, refit=True,
                   return_train_score=False, scoring=None, verbose=0)}, cached=False)
demo['result'].predict(['http://www.windows.com'])

输出> array(['Computers'],dtype =

这是堆栈跟踪的屏幕截图 Stack trace

0 个答案:

没有答案