谷歌浏览器提供语音文字(STT),许多智能手机应用提供STT。它得到了很好的认可。
我想在Visual Studio(MFC)中使用程序,但是没有方法可以执行STT。如果我使用Google Speech To Text Api,解决这个问题就很容易了。
如果没有关于STT的公开google api,除了开始之外,请告诉我另一种方法。
答案 0 :(得分:7)
据我所知,Google尚未记录其语音API,也不打算将其用于通用客户端。我相信他们的目的是让语音API支持他们的Android和Chrome产品。也就是说,Does Anyone Uses Google Speech API in Production?和Is there an API for Google's speech recognition technology?有更多信息。
由于您正在为Windows编程,为什么不使用内置的Windows语音引擎。您可以使用.Net或Microsoft.Speech的System.Speech功能并安装Microsoft提供的免费识别器。 Windows 7包含一个完整的语音引擎。其他人可以免费下载。有一个称为SAPI的相同引擎的C ++ API。见http://msdn.microsoft.com/en-us/magazine/cc163663.aspx。或http://msdn.microsoft.com/en-us/library/ms723627(v=vs.85).aspx。有关Windows的Microsoft引擎的更多背景知识 What is the difference between System.Speech.Recognition and Microsoft.Speech.Recognition?
我希望最后一个链接有用,这是.NET中语音识别的一个简单示例 - SAPI and Windows 7 Problem
答案 1 :(得分:2)
您可能会发现:https://gist.github.com/alotaiba/1730160很有用。基本上你需要在POST请求中将FLAC编码的音频文件发送到谷歌服务器。请注意,它只接受15秒以内的音频文件(对于简单的语音命令应用程序来说就够了)。
我正在调查这样的事情并且MS Speech API不适合我,即使它很好,因为它不支持Google的API所做的大多数语言(例如波兰语,MS文本转语音相同) )。