Question

我正在研究一个语音助手项目并使用 SpeechRecognition 库来识别用户的命令。我决定命名我的助手 ODI，并意识到 SpeechRecognition 库无法识别它。 “ODI”关键字被识别为“body”或“audi”。我想知道是否有办法做到这一点？

我希望它持续监听用户，一旦使用“ODI”这个词，识别器就会开始识别其他命令。

编辑：我安装了pocketsphinx来检测语音中的关键字，然后在匹配关键字后将其传输到谷歌识别器。我尝试了两种方法，使用 r.recognizer_sphinx(keyphrase=[('ode', 1)]) 和 LiveSpeech(keyword='ode')，包括阈值 1e+20 和 1e-40。这两种方法似乎都不起作用，一旦我提供了关键短语参数，它就会用关键字解释所有内容。

这是代码片段：

def get_user_input(self):
    with self.microphone as source:
        self.recognizer.adjust_for_ambient_noise(source, duration=1)
        print("listening")
        audio = self.recognizer.listen(source)

        try:
            transcript = self.recognizer.recognize_sphinx(audio, language='en-us', keyword_entries=[('ode', 1)]).lower()
            print("User said: {0}".format(transcript))
            time.sleep(1)
        except sr.UnknownValueError:
            transcript = ''
            print('Unable to recognize speech')
        except sr.RequestError:
            transcript = ''
            print("Request failed")
        except Exception as e:
            print("Repeat Command", e)
            return "None"
        if "ode" in transcript:
            new_transcript = self.recognizer.recognize_google(audio, language='en-ie').lower()
            return new_transcript

为什么有“ode”而不是“odi”的原因是CMU字典有“ode”，这听起来不错，但问题是它也一直将其他单词检测为“ode”。任何帮助将不胜感激，谢谢！

语音识别使用 python

0 个答案: