音频匹配(音频指纹识别)

时间:2014-10-14 09:55:32

标签: android audio-fingerprinting

我正在编写一个Android应用程序,让用户可以通过麦克风录制他的声音。把它保存在存储器中将其链接到特定内容(如联系人)。之后,用户再次呼叫该语音&应用程序应将其与保存的音频文件进行比较&找到与声音匹配的那个。

我搜索了很多&发现一些在线执行此操作的库,例如EchoPrint,可以从录制的音频和音频中生成指纹。将它发送到开源服务器&返回结果。但我需要离线这样做。

有人知道这样的图书馆吗?

2 个答案:

答案 0 :(得分:6)

如果您的目标是将用户的旧录音与新呼叫进行比较,那么服务器上的Python中的Dejavu或C ++中的Echoprint等音频指纹解决方案将无济于事您。它们用于对录制的音频片段和噪声进行识别和检索。 他们无法处理人类声音中的变异。请参阅解释here

如果是这种情况,那么你所指的是speaker recognition,这是更难的并涉及相当多的机器学习。对于大量用户(特别是在手机上离线)这样做很难,但是为了确定几个用户之间,它可能是可行的。

答案 1 :(得分:1)

下面是一个很好的图书馆。哪个好用。但您需要在此之前将音频文件转换为波形格式。

https://code.google.com/p/musicg/