如何在Python程序中嵌入Google Speech to Text API?

时间:2013-11-07 05:01:42

标签: python google-api speech-recognition

我有一个项目,我在客户端和主机之间创建了一个聊天程序,我必须在其中嵌入Speech to Text。我有什么办法可以在我的程序中嵌入Google Speech到Text API吗?

3 个答案:

答案 0 :(得分:5)

PyPI中有一个名为Speech Recognition的软件包看起来会这样做。实时(即通过麦克风)API看起来非常简单。

# NOTE: this requires PyAudio because it uses the Microphone class
import speech_recognition as sr
r = sr.Recognizer()
with sr.Microphone() as source:                # use the default microphone as the audio source
    audio = r.listen(source)                   # listen for the first phrase and extract it into audio data

try:
    print("You said " + r.recognize(audio))    # recognize speech using Google Speech Recognition
except LookupError:                            # speech is unintelligible
    print("Could not understand audio")

它还具有转录WAV文件的功能,作为后台进程运行,为转录提供置信度等。

答案 1 :(得分:2)

这可能是你不想在你的情况下使用的,但是对于其他可能需要这个用于一次性项目的人来说,我刚刚在一个简单的python客户端上攻击了一个使用API​​构建的API进入Chrome进行语音搜索:

https://github.com/korylprince/python-google-transcribe

要使它工作,你必须有16000Hz编码的FLAC,它们必须相当短。

另外,就像提到的评论一样,API是非官方的,所以谁知道它什么时候会停止工作。

答案 2 :(得分:2)

你可以试试Nexiwave的免费语音到文本api。这是python示例:http://nexiwave.com/api_samples/nexiwave_py.txt。另请查看API指南:http://nexiwave.com/index.php/119-integrate-in-5-minutes。很简单。

您必须先注册才能使用免费套餐。