我想为我的Android应用添加语音界面。两个要求:
我只需要在任何时候从一个小词典中识别出来 - 基本上任何可点击的元素都在屏幕上,并且大多数可点击的元素上已经有文字,所以它实际上就是"说你看到了什么"。
在应用程序可见时连续进行语音识别,但我可以忍受不得不说" Ok app"在演讲之前。
实现此目的的最佳方式是什么?
由于 NickB
答案 0 :(得分:0)
如果你想离线,我会看看PocketSphinx(https://cmusphinx.github.io/wiki/tutorialandroid/)。我用它来进行离线唤醒字识别。似乎更倾向于接受你说的话,而不是更少。
对于持续倾听,您可以查看IBM的Watson的语音到文本软件(https://github.com/watson-developer-cloud/android-sdk),这是一个基于云的语音文本。
我能够将两者结合起来,使用PocketSphinx来检测唤醒词然后使用Watson来获得良好的语音结果。