C / C ++中的Mel频率倒谱系数(MFCC)

时间:2012-10-29 15:21:23

标签: speech-recognition windowing mfcc

在C / C ++中是否有可用的MFCC实现?任何源代码或库?

我已经发现http://code.google.com/p/libmfcc/似乎很好。

2 个答案:

答案 0 :(得分:4)

2016年的回顾:

  • libmfcc很简单,MIT许可证,自2010年以来不受支持。
  • YAAFE提供MFCC和其他功能,LGPLv3,自2011年以来不受支持。
  • Kaldi过度杀伤,但它可以仅用于MFCC。 Apache License v2.0,仍然受支持。
  • PocketSphinx是语音识别的CMU工具包,CMU许可证(BSD风格),仍然受支持。
  • SPTK是来自日本的研究工具包,已修改BSD许可证,但仍受支持。
  • OpenSMILE有两个许可证:(1)用于研究和个人使用的灵活许可证;(2)商业用途许可证。

注意我提到的是PocketSphinx而不是Sphinx,因为后者是用Java编写的。

答案 1 :(得分:1)

您可以使用来自开源语音识别工具包的前端,例如KaldiSphinx