我已经在Android工作室成功安装了Alize,但是我没有意识到生成gmm / world.gmm文件。另外,我不确定,我们是否可以使用.3gp格式的录音。任何人都可以指导我,代码片段会有所帮助。
在问题被标记之前。请注意 1]我已阅读Alize上的所有证明文件 2]我已经完成了所有问题& StackOverflow,GitHub,ResearchGate上的问题 3]我尝试了TensorFlow和Microsoft Cognitive API的运气,但其中没有任何真正帮助过我。
答案 0 :(得分:0)
结帐此项目 https://github.com/umbatoul/Android-Voice-IDentification-App-using-SPRO-ALIZE-LIARAL/tree/master/assets 你可以在这里找到一个示例world.gmm。最有可能它会起作用。
其次,如果你在github上关注教程,你有几件事要做。 SPRO库有一些错误,因此您需要修改源代码。 (你需要做的就是在这里回答; https://github.com/ALIZE-Speaker-Recognition/android-alize/issues)
您必须使用音频文件的原始数据。所以这意味着你不能使用3gp作为输入。 (只需从互联网上找到一个基本的wav记录器类并删除所有标题部分。)
答案 1 :(得分:0)
对于world.gmm文件,您应该从http://alize.univ-avignon.fr/下载并运行01-GMM-UBM教程。要运行该教程,您需要LIA_RAL的二进制文件,您可以在这里找到其源代码https://github.com/ALIZE-Speaker-Recognition/LIA_RAL。成功运行本教程后,您应该拥有一个world.gmm文件。
关于录音,我使用了.wav文件。
如果到这个时候,您已经成功运行了android alize,请让我知道您的结果是否准确?我尚未得到准确的结果。