应用错误收集

用于说话人识别和语音识别的MFCC功能之间的区别？

时间：2016-12-07 14:20:00

标签： speech-recognition voice-recognition mfcc

我有一个概念性的问题。

我知道什么是MFCC。但我无法找到用于说话人识别和语音识别的mfcc特征向量之间的区别，即mfcc特征的哪一部分被用作两者之间的区别因素？另外我们如何在mfcc矢量的基础上区分两个扬声器？

1 个答案:

答案 0 :(得分：0)

功能非常相似。有什么区别的是系数的数量，窗口大小，规范化等等。看看this thread。

使用mfcc功能，您可以通过多种方式区分扬声器。两种最着名的技术是：

GMM / UBM技术：您为每个发言人和另一个GMM创建GMM作为背景模型，然后您对输入话语进行评分。
i-vector技术：这是对mfcc进行后处理以生成表示扬声器声学模型的新向量。此技术用于Microsoft Speaker Recognition Service和here's a description的工作原理。