Nexmo音频采样率

时间:2017-06-14 13:06:48

标签: audio nexmo

我们已将Nexmo Voice WebSocket API(电话)与Google语音识别API相关联,但质量很差。我们假设原因是采样率。 Google需要16KHZ但不需要上采样。 Nexmo是否支持此功能? 请参阅https://www.youtube.com/watch?v=cIxS_CF3t00

中的示例

1 个答案:

答案 0 :(得分:0)

Nexmos语音核心运行速度为16bit / 16kHz,但我们仅限于电话公司向我们发送呼叫的任何音频,通常这是8Khz G.711编解码器。

我们进行了上传,但是您发现使用语音识别API并不总是很好用。 我还没有测试过Google API,但它非常接近我的待办事项列表。 与此同时,您可能需要查看IBM Watson API,因为它们具有窄带语音模型,该模型似乎在电话方面效果更好。这里有一些示例代码https://github.com/nexmo-community/voice-watson-speechtotext