如何在一个句子上使用朴素贝叶斯

时间:2011-07-30 22:28:32

标签: algorithm pseudocode bayesian

如何使用朴素贝叶斯算法编写伪代码来将句子分类为好或坏?

我假设第一步是获得实验数据,使得你有一些好/坏词的例句,你有这些句子的例子输出(分类为好或坏)。但是,我如何能够使用这些数据来生成算法呢?

1 个答案:

答案 0 :(得分:1)

我不确定你在这种情况下的“好”或“坏”是什么意思,但你可能会发现this research paper on Bayesian spam filtering很有用,特别是关于“特定于域的属性”的部分,它描述了各种功能被选中试图过滤垃圾邮件。如果通过“好”和“坏”句子你试图找到这些句子的各种标准,那么本文可能是一个很好的领导。如果您通过“好”和“坏”句子寻找有关检测语法错误等的信息,那么这可能不是一个非常好的地方。 : - )