应用错误收集

语音识别将语音分割为音素级别

时间：2015-09-06 13:11:09

标签： voice-recognition cmusphinx phoneme

我正在考虑为我的母语开发语音识别软件，我正在考虑使用CMUSphinx-4。有一个CMU字典文件，其中包含英文单词，这些英文单词将原始单词的分割映射到其音素边界。例如， ABANDONED =＆gt; ['AH'，'B'，'AE'，'N'，'D'，'AH'，'N'，'D'] 我无法理解这背后的逻辑，我想为这个单词对话开发一个算法。如果有人知道这种转换的算法或者这种分裂是如何发生的，请与我分享。

1 个答案:

答案 0 :(得分：1)

原始单词到其音素边界

＆＃34;边界＆＃34;这里说错了。它将单词映射到音素序列，没有关于边界

如果有人知道这种转换的算法或这种分裂的发生方式，请与我分享。

我们的教程

中介绍了字典构造

http://cmusphinx.sourceforge.net/wiki/tutorialdict

检测Ruby中类似的发音词
如何获得语音识别音素？
iOS上的语音识别。语音到文本
基于语音（噪音）强度的语音识别？
语音识别：聆听特定的语音命令
语音识别将语音分割为音素级别
语音识别：单词之间的差距
使用非list的C＃语音识别。添加单词
语音到文本 - Alexa语音服务
语音到文本api的webapp词限制集

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？