HMM - 培训数据和格式

时间:2013-02-08 23:18:39

标签: signal-processing speech-recognition hidden-markov-models mfcc

我想要实现HMM(隐马尔可夫模型)以识别特定单词。到目前为止,我已设法提取信号的系数(MFCC),并想知道这是否是正确的数据,以便训练HMM?

另外,格式(下面)是否适合培训HMM?

格式:

Foreach样本,有一系列MFCC系数,我提供了其中两个样本作为例子......

-13.8033 0.645476 3.2174 -0.625136 -0.470134 -2.96368 0.701151 0.464246 1.1898 -1.88515 0.0805242 0.311573 0.732487

-19.4252 -5.65454 0.853437 0.317219 0.146167 -1.93742 0.381944 -2.01793 -0.561144 -0.896783 -0.105491 -1.06504 -0.797318

希望有人可以提供帮助:)

1 个答案:

答案 0 :(得分:0)

您可以采用两种方法。

一个是对这些矢量进行矢量量化,以便将连续MFCC矢量转换为HMM的离散观测值。

其他是使用连续方法在HMM中进行训练。 你可以在这个帖子中看到更多:

Simple speech recognition from scratch