我不明白如何在Windows桌面上使用Google Cloud API转换文本中的连续语音。
我尝试使用Google,Google Cloud和Sphinx引擎进行语音识别示例。使用Google,我只能将语音(最多10秒)转换为文本。 Sphinx的效果要好得多,但与Google相比,其识别质量很差。
这是我在这里找到的标准代码: https://github.com/Uberi/speech_recognition/blob/master/examples/microphone_recognition.py
实际识别的结果很好,但是不能解决连续语音识别的问题。 我通过Google Clour服务找到了异步语音识别的样本,但它们都是基于音频文件而不是麦克风
答案 0 :(得分:0)
连续语音识别是一项特定且困难的任务,需要专门为此任务构建的识别器。
您链接的示例代码使用的所有Web API(Google Cloud API以及其他)都不支持连续语音识别。它们不能用于此目的。