我正在考虑使用Watson的Speech to Text软件来帮助推动我们产品的语音命令。
我看到的所有示例都要求用户在发出命令之前按下按钮。但是,我不想让用户按下按钮,而是想要一个“唤醒词”或关键字来表示我们产品的命令开始。也就是说,我不想继续将声音传递给Watson的Speech To Text软件,但我正在寻找一种让用户提供关键字或唤醒单词以开始发送声音的方法,然后让Watson的Speech To Text返回它听到的命令的文字。
例如,“OK,Google”开始向Google发送语音文字。
IBM是否提供了一种创建我自己的“OK,Google”关键字的方法,而无需将我的应用程序可能听到的所有内容发送给Watson的语音文本?
答案 0 :(得分:2)
目前,Watson Speech to Text服务不支持单独的“唤醒字”检测模块。为此,我们当前的客户将使用一些边缘设备或服务来处理。像Snowboy(https://snowboy.kitt.ai/)或类似的东西。
答案 1 :(得分:0)
不确定Watson是否支持唤醒词。 如果您计划将语音集成到可在PC,平板电脑或手机上运行的软件应用程序中,则可以实现唤醒字。您可以使用Microsoft语音识别引擎或Sphinx实现它。
以下是使用Microsoft语音引擎的示例代码。
S = set(L)
[L.count(item) for item in S]
您的应用程序将在唤醒单词" Cooper"说出来了。在事件处理程序代码中,您可以捕获/记录声音并将其发送给Watson。