我希望将语音命令添加到将作为自助服务终端在平板电脑上运行的Android应用。我不希望用户必须按下按钮,因为用户正在做更重要的事情(例如驾驶汽车,驾驶飞机或进行脑部手术),并且可以通过单按钮完成命令。 / p>
我看到教程描述了如何向文本添加语音并让用户按下按钮并获取文本,但没有任何内容允许唤醒单词“Okay,Google”启动语音识别(更不用说自定义唤醒词)。
我查看了使用Google语音操作以“Okay,Google”开头,然后向我的应用程序发送内容(注册一个意图),但必须对一个特定用户进行培训(至少对于我试过的平板电脑)它在)。我每天都会有不同的用户(可能每天超过一天),没有机会训练设备。
我曾与CMUSphinx合作,发现它太难以发现唤醒词了。
有没有办法添加“Okay,Google”作为开始在我的应用中收听文字的方式?
答案 0 :(得分:0)
使用PocketSphinx进行离线唤醒工作识别,然后我将麦克风交给IBM的Watson的Speech to Text软件,该软件可在互联网上运行并返回相当可靠的结果。
答案 1 :(得分:-1)
不幸的是,你想要实现的目标是不可能的。如果我理解了你的概念:第三方应用程序将唤醒设备并根据一组命令行动(从安全的角度来看,这是非常糟糕的)。
您可以做的最接近的是语音操作Api - https://developers.google.com/voice-actions/system/