我读了很多关于此的文章,但我不明白我该怎么做。
我尝试使用MFM功能为HMM构建基本的语音识别系统,我使用了可用的数据here。我使用Matlab来做到这一点。
到目前为止,我使用this library从语音文件中提取了MFCC向量。我不明白的是我如何将这些功能用于HMM。
您能解释一下我如何训练HMM。我正在使用matlab中的hmm实现。请不要将我介绍给其他图书馆,因为我实际上是想了解嗯嗯工作。
如何初始化过渡和发射矩阵?
我想每个州都会在单词中发出特定的音素,那么为了训练HMM我们应该如何通过MFCC向量?
我应该采取哪些步骤来训练HMM?
HMM的matlab实现函数给出了here
编辑:已经很长时间了,但我想这个问题仍然与它所遇到的观点数量有关,我确实解决了这个问题,我可以在我的GitHub上找到该代码
答案 0 :(得分:1)
你不能用这个hmm训练来自MFCC载体的语音HMM。该框架仅支持数字序列,不支持特征向量。它是一个简单的离散HMM工具箱。
你必须像这样使用面向语音的库: