出于好奇,因为我一直想知道这一点。应用程序Shazam如何工作?我知道如何使用它,我说的是编程方面。应用程序如何收听歌曲的任何部分然后给你结果?显然它从数据库接收它的歌曲信息,但是有一种 NO 的方式,有人可以输入该数据库中人类已知的每首歌曲。此外,Shazam如何不是一直不断更新?新歌不断发行,但是Shazam已经将未来的歌曲编入其中。这对我来说只是令人难以置信,我只想知道这一切是如何运作的。我知道这不是一个帮助问题,但有人可以澄清一下吗?谢谢!
答案 0 :(得分:2)
Shazam只从傅里叶变换开始(这并不奇怪,因为几乎所有音频处理都以这种方式工作)。
如果您愿意,可以阅读Avery Wang的原始论文。他是Shazam算法的发明者。我碰巧认为它最好被解释为最近邻技术,这就是为什么我们将它作为“数据挖掘技术,第3版”第9章中的一个例子。
您可能对我们在那里所说的内容感兴趣(http://www.amazon.com/Data-Mining-Techniques-Relationship-Management/dp/0470650931/ref=pd_sim_b_5)。
答案 1 :(得分:0)
他们对发布的链接没有太多说明
该算法基于傅立叶波,其允许将数学函数表达为谐波函数的线性和。此转换允许在时间与频率之间进行映射,这正是您创建语音识别所需的。
我发现很难相信Shazaam拥有Fourier's transformation专利权。但如果你试图建立一个“第二Shazaam”,你可能会失败,因为他们已经占领了整个市场......