如何在Android上使用Alize System进行说话人识别

时间:2018-03-30 10:08:11

标签: gmm

我已经在Android工作室成功安装了Alize,但是我没有意识到生成gmm / world.gmm文件。另外,我不确定,我们是否可以使用.3gp格式的录音。任何人都可以指导我,代码片段会有所帮助。

在问题被标记之前。请注意 1]我已阅读Alize上的所有证明文件 2]我已经完成了所有问题& StackOverflow,GitHub,ResearchGate上的问题 3]我尝试了TensorFlow和Microsoft Cognitive API的运气,但其中没有任何真正帮助过我。

2 个答案:

答案 0 :(得分:0)

结帐此项目 https://github.com/umbatoul/Android-Voice-IDentification-App-using-SPRO-ALIZE-LIARAL/tree/master/assets 你可以在这里找到一个示例world.gmm。最有可能它会起作用。

其次,如果你在github上关注教程,你有几件事要做。 SPRO库有一些错误,因此您需要修改源代码。 (你需要做的就是在这里回答; https://github.com/ALIZE-Speaker-Recognition/android-alize/issues

您必须使用音频文件的原始数据。所以这意味着你不能使用3gp作为输入。 (只需从互联网上找到一个基本的wav记录器类并删除所有标题部分。)

答案 1 :(得分:0)

对于world.gmm文件,您应该从http://alize.univ-avignon.fr/下载并运行01-GMM-UBM教程。要运行该教程,您需要LIA_RAL的二进制文件,您可以在这里找到其源代码https://github.com/ALIZE-Speaker-Recognition/LIA_RAL。成功运行本教程后,您应该拥有一个world.gmm文件。

关于录音,我使用了.wav文件。

如果到这个时候,您已经成功运行了android alize,请让我知道您的结果是否准确?我尚未得到准确的结果。