我会在Airflow上建立机器学习管道。
示例)
result = model.fit()
但是DAG文件:( sample.py )每次都会刷新。
所以我不能存储经过训练的模型。
我应该如何对待训练有素的模型?
还是应该将经过训练的模型数据存储在外部?
然后采用训练有素的模型吗?
答案 0 :(得分:0)
将模型存储在pickle文件中,并在需要时从同一文件中检索模型。
import pickle
result = model.fit()
# save the model to disk
filename = 'my_model.sav'
pickle.dump(model, open(filename, 'wb'))
# load the model from file for later use
reload_model = pickle.load(open(filename, 'rb'))
result_final = reload_model.score(X_test, y_test)
print result_final