所以我目前使用[SKiLearn][1]
训练了一个多项式朴素贝叶斯分类器
现在我可以做的是使用预测分类测试数据。
但是如果我想每天晚上运行这个脚本,我显然需要一个已经训练好的分类器!现在我希望能够做的是采用分类器系数,信息词,并使用这些来分类新数据。
这可能 - 开发我自己的分类方法吗?或者我应该只是每晚训练SkiLearn分类器?
编辑:有一件事,我似乎可以做,是保留和save my trained classifier。
然而,通过逻辑回归,您可以获取系数并将其用于新数据。 NB有什么类似的东西吗?
答案 0 :(得分:1)
因此,可能的程序可能是:
训练阶段:
1)训练模型
2)使用get_params()
获取模型的参数3)将参数保存到二进制文件中(例如,使用pickle.dump())
预测阶段:
1)从二进制文件加载模型的参数(例如,使用pickle.load())
2)使用set_params()
设置模型的参数3)使用predict()函数
对新数据进行分类希望有所帮助。