用于说话人识别和语音识别的MFCC功能之间的区别?

时间:2016-12-07 14:20:00

标签: speech-recognition voice-recognition mfcc

我有一个概念性的问题。

我知道什么是MFCC。但我无法找到用于说话人识别和语音识别的mfcc特征向量之间的区别,即mfcc特征的哪一部分被用作两者之间的区别因素? 另外我们如何在mfcc矢量的基础上区分两个扬声器?

1 个答案:

答案 0 :(得分:0)

功能非常相似。有什么区别的是系数的数量,窗口大小,规范化等等。看看this thread

使用mfcc功能,您可以通过多种方式区分扬声器。两种最着名的技术是:

  • GMM / UBM技术:您为每个发言人和另一个GMM创建GMM作为背景模型,然后您对输入话语进行评分。
  • i-vector技术:这是对mfcc进行后处理以生成表示扬声器声学模型的新向量。此技术用于Microsoft Speaker Recognition Servicehere's a description的工作原理。