持续的语音识别

时间:2017-07-27 19:54:58

标签: python speech-recognition google-speech-api

我目前正在开发一个项目,我需要创建一些用户可以与产品交谈的功能(Raspberry Pi 3)。通过谈话我的意思是用户应该能够说出一个或两个单词,比如“product start”到Pi,然后它就会被激活并做到这一点。

正因为如此,当用户说出某个单词组合时,Pi需要能够持续听取并激活。

我已经实现了SpeechRecognition库,这种工作但很遗憾,Pi会听到最多约10秒的时间。

我想知道是否有任何图书馆可以帮助我处理我的用例,欢迎任何帮助。

1 个答案:

答案 0 :(得分:1)

你能更好地解释一下

是什么意思吗?
  遗憾的是,Pi会听到最多约10秒的时间。

根据我使用CMUSphinx的经验(让我为你的用例推荐pocketphinx版本),连续工作没有问题。 您是否设法知道问题是在Pi端还是SpeechRecognition端?

你在SpeehRecognition背后使用什么引擎。 CMUSphinx,谷歌,微软?对于谷歌和微软,他们有10秒的限制是正常的。但是,使用CMUSphinx不应该发生这种情况。但是,您可能需要了解一些如何设置ASR系统。