我目前正在开发一个项目,我需要创建一些用户可以与产品交谈的功能(Raspberry Pi 3)。通过谈话我的意思是用户应该能够说出一个或两个单词,比如“product start”到Pi,然后它就会被激活并做到这一点。
正因为如此,当用户说出某个单词组合时,Pi需要能够持续听取并激活。
我已经实现了SpeechRecognition库,这种工作但很遗憾,Pi会听到最多约10秒的时间。
我想知道是否有任何图书馆可以帮助我处理我的用例,欢迎任何帮助。
答案 0 :(得分:1)
你能更好地解释一下
是什么意思吗?遗憾的是,Pi会听到最多约10秒的时间。
根据我使用CMUSphinx的经验(让我为你的用例推荐pocketphinx版本),连续工作没有问题。 您是否设法知道问题是在Pi端还是SpeechRecognition端?
你在SpeehRecognition背后使用什么引擎。 CMUSphinx,谷歌,微软?对于谷歌和微软,他们有10秒的限制是正常的。但是,使用CMUSphinx不应该发生这种情况。但是,您可能需要了解一些如何设置ASR系统。