任何人都知道已经托管的任何好的服务器端语音识别引擎?即我希望能够调用一个简单的Web API发布一些声音数据并获取文本。不必是免费的 - 但希望可以免费试用。
答案 0 :(得分:33)
有几种IVR服务将整个VOIP会话(电话呼叫)作为一个完整的应用程序托管,而不是提供单个服务交易“àlacarte”。如果您要使您的程序看起来像VOIP呼叫,您可以使用其中一些服务完成它。
Voxeo发布了list of free (and low cost) IVR hosting providers针对有限使用的开发人员。毫不奇怪,所有都需要注册。
另一种可能性是与Vlingo,Twilio或Tropo进行直接查询,因为它们可能会向您推销您所需要的内容。
AT& T宣布推出Speech API。您发送音频 - 它返回XML或JSON数据格式的文本。另见developer site。
另一种可能性是来自Nuance的Dragon Mobile SDK,它面向寻求API的个人开发者,使消费者应用程序具有语音和/或文本到语音功能。
似乎有几个新的提供商提供完全您正在寻找的内容:语音样本,文本输出。以下列于Programmable Web:
另请注意,Loquendo现在是Nuance的一部分。
AT& T的Speech API有一个few targeted SDKs(Android,iOS,PhoneGap,Titanium,Windows) - 其中一些托管在GitHub
上。甚至有source for a Unity 3D demo。
OneTok已将其产品重新制定为iOS
和Android
的SDK。
显然 Voice Genie 产品已被Genesys彻底消化,因此可以找到它的一点痕迹。鉴于Genesys对大型企业的定位,很难知道他们是否有任何小批量或商品供应。
Plumvoice似乎扩大了他们的产品。
与之前的许多人一样,Vlingo现在是Nuance的一部分。
(我试图在原始答案中更新任何损坏的链接。)
让这个答案保持最新是一个Sisyphean任务。
Voxeo的免费(和低成本)IVR托管服务提供商名单现在重新发布到AT&T Speech API,在完整披露中,我现在已经在其中进行了实质性的参与,因此,取消了我提供链接的资格几乎任何事情都没有打击我的信誉。
也就是说,演讲/ NLP市场中有很多玩家。尽职尽责。