开源音频模式识别(指纹打印)

时间:2011-06-07 17:24:48

标签: audio pattern-recognition audio-fingerprinting

是否有任何开源音频指纹识别解决方案提供“Shazam like”解决方案?

Shazam使用来自Landmark digital的商业解决方案,但我正在寻找替代方案(即使在准确性和性能方面表现较差)开源解决方案。

任何人都知道有关此类实现甚至已发布的未实现算法的信息吗?

5 个答案:

答案 0 :(得分:20)

  • echoprint看起来像是商业图书馆的可靠替代品。

用于语音识别:

我们只测试了echoprint,到目前为止一直很好。

我知道答案有点晚了但是当这个页面在谷歌弹出时,我们可能会随着时间的推移改进它:)

编辑为CMU是面向语音的

答案 1 :(得分:12)

有一些开源音频识别项目,虽然你可以忘记商业音频识别服务的质量/性能,如Shazam,SoundHound等。它还取决于你想要做什么样的识别(音频)文件指纹/标记,实时识别,OTA(空中)识别等。)

打开Surce

  • AcoustID/MusicBrainz提供执行音频指纹识别和元数据关联(指纹识别器和服务器)的工具。您可以建立自己的指纹/元数据服务器或使用MusicBrainz的服务。音频文件指纹识别和识别的良好解决方案,不适用于实时高性能应用(即OTA)。我们还对音频流监控(广播监控)进行了测试,但结果非常糟糕。

  • Echoprint提供与AcoustID(指纹识别器和服务器+元数据)相同的工具,也可以用于音频流监控,因为它可以识别从音频中的任何位置获取的片段,但具有良好的准确性(但是我不会将它用于严肃的商业应用)。他们还声称它适用于OTA应用,但性能无法用于生产用途。

  • Last.fm 虽然他们已经开源了指纹识别模块,但还没有完全开源。您必须查询其身份和元数据提供商服务,因为他们没有提供完整的解决方案。

答案 2 :(得分:9)

确定。不同的搜索关键字,我查找的所有结果。

http://musicbrainz.org/doc/Audio_Fingerprint

感谢所有观看

的人

答案 3 :(得分:1)

如果您正在寻找JAVA库,那么请去MusicG,我已经在我过去的项目中使用它并且工作正常。 http://code.google.com/p/musicg/

答案 4 :(得分:1)

如果您正在寻找.NET中的解决方案,请检查SoundFingerprinting库。

它是开源的,建立在使用Wavelets研究论文的内容指纹识别之上。

该算法与Shazaam的算法不同,但总体思路相似:从频谱中提取最突出的系数,然后使用它们构建指纹以供以后检索。

可以找到算法描述here