当存储使用sklearn训练的分类器时,我可以选择pickle(或cPickle)和joblib.dump()。
使用joblib.dump()除了性能之外还有什么好处吗?由pickle保存的分类器能否产生比使用joblib保存的分类器更差的结果?
答案 0 :(得分:3)
他们实际上使用相同的协议(即joblib使用pickle)。查看joblib.dump
的{{3}} - 您可以使用joblib的参数指定pickle压缩级别。
答案 1 :(得分:1)
joblib特别适用于sklearn使用的NumPy数组,因此根据您使用的分类器类型,您可能会使用joblib获得性能和大小优势。
否则,pickle可以正常工作,因此无论您使用哪个序列化库,保存经过训练的分类器并再次加载它都会产生相同的结果。另请参阅docs of sklearn on this topic.
请注意,joblib包含在sklearn中。