如何在django视图中实现更快的tfidfvectorizer加载时间?

时间:2017-01-09 01:35:58

标签: django scikit-learn django-cache joblib

我有一个TfidfVectorizer符合约120,000个功能,我使用joblib.dump保存到文件中。我稍后使用joblib.load在django视图中加载该模型,但它太慢(需要约2秒)。提高装载速度的最佳方法是什么?我应该使用django的缓存框架缓存模型吗?在使用joblib.dump进行序列化时,我应该压缩模型吗?有没有办法将模型加载到内存中并将其保留在那里而不是每次调用视图时重新加载它?

1 个答案:

答案 0 :(得分:0)

模型在请求之间不会发生变化,因此,我们希望将其加载到内存中一次并将其保留在内存中。这可以通过加载模型并将其分配给全局变量在views.py中实现。