speech-recognition - 从HMM-GMM中的语音识别纸了解变量 - Thinbug

从HMM-GMM中的语音识别纸了解变量

时间：2020-07-16 18:18:06

标签： speech-recognition hidden-markov-models gmm

我正在阅读Mark Gales和Steve Young撰写的this论文，内容涉及使用HMM-GMM进行语音识别。在第205页第二段中，其内容为：

“ 对于每个发声Y ^（r），r = 1，。。。，R，长度T ^（r）找到与话语中的单词序列相对应的HMM，并构建相应的复合HMM “

我不清楚Y ^（r）和Tsup>（r）是什么？有人可以澄清吗？我不明白 r 和 R 代表什么？

在this论文中，标题为：使用图形处理单元并行执行维特比声学模型训练，在第2.1节中，作者提到：

“ 给定一组训练观测值Osup>（r），1≤r≤R且HMM状态序列1 “

我知道两个句子都相似，但是在上面的论文中，我也不明白什么是 r 和 R 。

1 个答案:

答案 0 :(得分：0)

在HMM中，您有按时间顺序观察。语音识别是一项特殊的任务，因为观察长度不是固定的而是可变的。

据我所知，观测值Y（r）表示为：

Y（r）= {Y_0，Y_1，Y_2，...，Y_R} 因此r是r = 0、1，...，R的索引。

在这种情况下，r是观测值的计数，R是最后一个观测值。

相关问题

最新问题

我写了这段代码，但我无法理解我的错误

我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？

是否有可能使 loadstring 不可能等于打印？卢阿

java中的random.expovariate()

Appscript 通过会议在 Google 日历中发送电子邮件和创建活动

为什么我的 Onclick 箭头功能在 React 中不起作用？

在此代码中是否有使用“this”的替代方法？

在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化

每千个数字得到

更新了城市边界 KML 文件的来源？