标签: speech-recognition voice-recognition mfcc
我有一个概念性的问题。
我知道什么是MFCC。但我无法找到用于说话人识别和语音识别的mfcc特征向量之间的区别,即mfcc特征的哪一部分被用作两者之间的区别因素? 另外我们如何在mfcc矢量的基础上区分两个扬声器?
答案 0 :(得分:0)
功能非常相似。有什么区别的是系数的数量,窗口大小,规范化等等。看看this thread。
使用mfcc功能,您可以通过多种方式区分扬声器。两种最着名的技术是: