我对shazam或soundhound是如何工作感兴趣。
它如何录制语音并制作与指纹数据库相似的指纹,以便找到匹配项?
我即将开始用C / C ++编写一些软件,但不确定使用哪些库,看到有一些来自Microsoft的Speech SDK。你有什么建议,从哪里开始了解'分析声音和玩它的过程?
我会感谢您分享的每一个提示或想法:]
答案 0 :(得分:3)
您可以查看一些现有的软件:
AudioDB :C ++
mercurial repo:http://code.soundsoftware.ac.uk/projects/audiodb/
Sonic Visualiser :使用Qt4用C ++编写SV库