应用错误收集

max / msp / jitter声音 - 语音分割/识别/分析

时间：2014-11-24 12:59:03

标签： speech-recognition speech max-msp-jitter

我正在尝试开发一种语音/声音识别程序，它可以提取一些有用的数据，例如声音。例如..基频/ MFCC /质心等语音通常在20到30毫秒的帧中分段，窗口分析是移动了10毫秒。

我想找到一个补丁/对象或一些有用的建议，我如何使用框架，移位，我更喜欢进行声音分析分割的窗口分割。

有人知道这样做的方法吗？

1 个答案:

答案 0 :(得分：0)

你可以尝试

ejs：http://www.e--j.com/index.php/what-is-zsa-descriptors/
FTM库中的Gabor对象（gbr。*）：http://ismm.ircam.fr/ftmco/