标签: speech-to-text google-speech-api
问候StackOverflow专家,
我想澄清一下Google Speech API是否使用梅尔频率倒谱系数(MFCC)特征提取?
如果是这样,是否有任何关于它的文章/期刊?
请赐教。
谢谢你,祝你有美好的一天。
答案 0 :(得分:0)
大多数现代系统使用log-mel滤波器组,而不是真正的MFCC。谷歌还增加了噪音减法。
您可以在Google技术上查看此论文:
Acoustic Modeling for Google Home