Shazam如何避免误报?

时间:2018-05-15 18:45:45

标签: algorithm audio sound-recognition shazam

简而言之,Shazam会记录您正在收听的歌曲的指纹,并将其发送到后端服务器以将其与指纹数据库进行匹配。然后,查找过程为索引中的每首歌曲生成偏移的直方图,并声明在单个偏移处具有最多匹配的歌曲成为赢家。有关该算法的详细信息,请参阅原始论文here

根据this blog post,Shazam将其索引分为层,以加快查找过程。最流行歌曲的指纹存储在第一层,首先查询。如果在第一层中找不到匹配的歌曲,则搜索然后进入第二层,依此类推。

我没有得到的是Shazam如何避免这种架构的误报?例如。当较低级别的匹配得分较高的流行音乐较少时,如何避免匹配具有高匹配分数的流行音乐?它是否使用评分函数和阈值?如果是,评分函数会是什么样的?

0 个答案:

没有答案