如何在Python中使用语音识别检测一个单词

时间:2016-01-04 17:29:08

标签: python speech-recognition

我知道如何用Python检测语音,但这个问题更具体: 如果Python只能识别单词,我怎么能让Python只听一个单词然后返回True。

我知道,我可以让Python一直听,然后做出类似的东西 伪代码:

while True:
    if stt.listen() == "keyword":
        return True

我已经做到了这一点,并且该程序在经过几分钟的总听之后就会挂断(见最后)。所以我需要一种只听一个特定单词的方法。

“挂断”是什么意思?程序没有崩溃但没有响应。它不再听我的声音了,当我按STRG + C时它什么也没做。

我正在寻找类似的东西:

while True:
    if stt.waitFor("keyword"):
        return True

希望你明白,最好的问候

1 个答案:

答案 0 :(得分:5)

import sys, os
from pocketsphinx.pocketsphinx import *
from sphinxbase.sphinxbase import *
import pyaudio

modeldir = "../../../model"
datadir = "../../../test/data"

# Create a decoder with certain model
config = Decoder.default_config()
config.set_string('-hmm', os.path.join(modeldir, 'en-us/en-us'))
config.set_string('-dict', os.path.join(modeldir, 'en-us/cmudict-en-us.dict'))
config.set_string('-keyphrase', 'forward')
config.set_float('-kws_threshold', 1e+20)


p = pyaudio.PyAudio()
stream = p.open(format=pyaudio.paInt16, channels=1, rate=16000, input=True, frames_per_buffer=1024)
stream.start_stream()

# Process audio chunk by chunk. On keyword detected perform action and restart search
decoder = Decoder(config)
decoder.start_utt()
while True:
    buf = stream.read(1024)
    if buf:
         decoder.process_raw(buf, False, False)
    else:
         break
    if decoder.hyp() != None:
        print ([(seg.word, seg.prob, seg.start_frame, seg.end_frame) for seg in decoder.seg()])
        print ("Detected keyword, restarting search")
        decoder.end_utt()
        decoder.start_utt()

有关详细信息,请参阅http://cmusphinx.sourceforge.net