应用错误收集

在声纹中是否有任何与文本无关的功能

时间：2015-12-17 07:18:02

标签： artificial-intelligence signal-processing speech-recognition

我是演讲和演讲者识别问题的新手我明确了mfcc的工作方式，但据我所知（并且发现），不同单词之间的系数会有所不同。我的问题：还有其他任何与文本无关的特征提取方法吗？如果是这样，请参考他们。任何提示都会非常有用。提前谢谢。

1 个答案:

答案 0 :(得分：0)

文本无关的含义尚不清楚。 MFCC（和任何其他）特征是实系数的矢量。类似的音频帧（就人类感知而言）可能会给你相似的系数，但它们也可能没有。如果我们谈论语音识别，那么背景噪声和个别语音特征可以大大改变系数。这就是为什么使用诸如GMM或DNN的分类器来确定给定特定MFCC的语音单元的原因。如果您对其他特征提取算法感兴趣，可以阅读有关LPC和PLP特征的信息。

Apache Sling中是否有任何工作流功能
有没有简单的方法来使用zend_pdf打印文本？
是否有任何软件功能管理工具？
是否有任何编程语言独立的加密算法？
有没有ipdb打印寻呼机？
是否有任何最佳实践来准备基于文本的分类功能？
java中的选项卡是否有任何与平台无关的字符？
在声纹中是否有任何与文本无关的功能
是否有任何内置的方式在Java中打印样式文本？
Twilio中有不同类型的女声吗？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？