气流:存储机器学习模型

时间:2019-07-02 08:16:56

标签: python machine-learning airflow

我会在Airflow上建立机器学习管道。
示例)

result = model.fit()

但是DAG文件:( sample.py )每次都会刷新。

enter image description here

所以我不能存储经过训练的模型。

我应该如何对待训练有素的模型

还是应该将经过训练的模型数据存储在外部?
然后采用训练有素的模型吗?

1 个答案:

答案 0 :(得分:0)

将模型存储在pickle文件中,并在需要时从同一文件中检索模型。

import pickle 
result = model.fit()
# save the model to disk
filename = 'my_model.sav'
pickle.dump(model, open(filename, 'wb'))

# load the model from file for later use
reload_model = pickle.load(open(filename, 'rb'))
result_final = reload_model.score(X_test, y_test)
print result_final