语音识别中HMM的观察序列格式

时间:2013-06-01 00:59:50

标签: java signal-processing speech-recognition hidden-markov-models

我正在尝试开发一种系统,用于在语音识别中分离非垃圾中的垃圾。我正在使用隐马尔可夫模型的jahmm实现。我对我应该将训练数据作为观察序列提供给系统的格式感到困惑。 HMM中的每个州由什么组成?我试过阅读手册但无法理解。谢谢

1 个答案:

答案 0 :(得分:2)

  

我对我应该将训练数据作为观察序列提供给系统的格式感到困惑。

要了解您可以阅读来源的格式

public <O extends Observation> Hmm<O>
    learn(Hmm<O> initialHmm, List<? extends List<? extends O>> sequences)

建议输入数据必须是观察序列列表。每个观察序列都是观察列表。如果您不理解列表是什么,那么对CS的一个很好的介绍可以帮助您

  

HMM中的每个州是由什么组成的?

HMM的状态只是数学结构的元素。它们不是由任何东西组成的。它们具有与之相关的概率分布。您可以在HMM tutorial中找到更多详细信息,在开始使用HMM之前,您应该更好地阅读这些详细信息。

图书馆本身也在文档中描述了一切:

http://jahmm.googlecode.com/svn/javadoc/0.6.2/index.html