我需要制作一款可以识别我创建的某些声音文件的Android应用,然后对识别进行操作。所以类似于Shazam / Soundhound,但有我自己的声音文件。 是否有任何API或SDK或其他东西? 我读过关于Echoprint的内容,但我知道它适用于Windows和iOS,对我来说似乎很难。那会有用吗?或者还有其他选择吗?
PS:为了说清楚,我不想要语音识别或文字转语音。我的声音文件可能有音乐,语音失真,效果等
答案 0 :(得分:4)
ACRCloud支持音乐/音频搜索引擎,支持5000万首歌曲/用户上传内容,适用于iOS / Android / Linux的SDK,可在注册后下载(http://console.acrcloud.com/signup)。客户分为三层:
希望这有帮助
答案 1 :(得分:1)
一年后,我已经按照here的解释使用了为Android编译的Echoprint。它得到了一些结果,但总的来说它的效果非常差,特别是对于自定义声音文件。 Echoprint不是为OTA识别而设计的。我会推荐它用于测试/原型设计,但不适用于生产。不幸的是,到目前为止,它是唯一允许您拥有自己的服务器和声音文件的人。