朴素贝叶斯分类器

时间:2016-09-02 14:46:19

标签: matlab classification signal-processing speech-recognition naivebayes

所以我正在建立一个自动语音识别系统,我想使用贝叶斯定理作为分类器。 我还在阅读它并试图理解它的概念,所以尽量以最简单的方式回答我。

我使用MFCC从我的演讲中提取功能并创建了我的Class_template,这是一个数组,其中包含行作为单词的特征,列代表每个单词(我只是使用十个单词的词汇,所以十列是十个单词)。 现在我有我的一系列功能,我输入了一个新的测试词;对它进行操作并将其转换为特征向量,这一切都很好。

我想使用贝叶斯定理来确定我的class_template中哪个类(单词)是否属于我的新测试单词。

所以我开始计算每个单词的平均值和标准偏差(我的测试单词和类),现在认为我应该将这些值插入PDF(概率密度函数),并使用它计算我的测试词对class_template中每个单词的概率,即最高概率​​。我猜是正确的答案。

1 - 所以我做错了什么,我正朝着正确的方向前进?

2 - 任何提示,指示或做什么???

3 - 当我计算PDF时,我应该插入是什么意思和标准,这是我或我的测试词?

感谢。

1 个答案:

答案 0 :(得分:0)

到目前为止你所描述的大多是正确的,但是模式类的先验概率怎么样?如果你认为它是一个统一的分布,那么它与MLE是一样的,并且在小样本上会有不好的表现。