标签: speech-recognition speech max-msp-jitter
我正在尝试开发一种语音/声音识别程序,它可以提取一些有用的数据,例如声音。例如..基频/ MFCC /质心等 语音通常在20到30毫秒的帧中分段,窗口分析是 移动了10毫秒。
我想找到一个补丁/对象或一些有用的建议,我如何使用框架,移位,我更喜欢进行声音分析分割的窗口分割。
有人知道这样做的方法吗?
答案 0 :(得分:0)
你可以尝试