新出现的分类 - 多项式朴素贝叶斯

时间:2014-05-15 12:39:29

标签: python machine-learning classification scikit-learn

所以我目前使用[SKiLearn][1]训练了一个多项式朴素贝叶斯分类器 现在我可以做的是使用预测分类测试数据。

但是如果我想每天晚上运行这个脚本,我显然需要一个已经训练好的分类器!现在我希望能够做的是采用分类器系数,信息词,并使用这些来分类新数据。

这可能 - 开发我自己的分类方法吗?或者我应该只是每晚训练SkiLearn分类器?

编辑:有一件事,我似乎可以做,是保留和save my trained classifier

然而,通过逻辑回归,您可以获取系数并将其用于新数据。 NB有什么类似的东西吗?

1 个答案:

答案 0 :(得分:1)

你是说[sklearn]吗?你在使用python吗?如果是这种情况,事实证明[sklearn]提供了获取模型参数的函数[get_params(deep = True)]以及设置它们的函数[set_params(** params)]。

因此,可能的程序可能是:

训练阶段:

1)训练模型

2)使用get_params()

获取模型的参数

3)将参数保存到二进制文件中(例如,使用pickle.dump())

预测阶段:

1)从二进制文件加载模型的参数(例如,使用pickle.load())

2)使用set_params()

设置模型的参数

3)使用predict()函数

对新数据进行分类

希望有所帮助。