twilio在speech2text处理中收集了显着的延迟

时间:2017-11-30 05:56:21

标签: twilio

我使用TwilioML来收集用户的输入。

我所看到的是4-6秒的显着延迟。从用户停止讲话到我的服务(端点)被调用的时间。即使用非常简单的句子(例如我的名字是约翰)也会发生这种情况。

这是一个已知问题吗?从用户体验的角度来看,这不是一次很棒的体验。

我试图添加一个'填充物'通过但它没有任何影响,因为我可以开始它的早期是调用端点。 也许有一种方法可以在音频转换为文本的同时并行播放文件。

1 个答案:

答案 0 :(得分:0)

来自documentation

  

'超时'属性设置Twilio将以秒为单位的限制   等待来电者按下另一个数字或说出另一个字   继续前进并向“行动”提出要求。 URL。例如,如果   '超时'是' 3',Twilio将等待三秒钟给来电者   在提交之前,按另一个键或说另一个单词   输入数字或语音到'动作' URL。 Twilio等到   在开始之前完成所有嵌套动词的执行   超时期限。

您看到延迟时间在4到6秒之间的事实可能是因为默认超时设置为5秒。

您是否尝试过使用partialResultCallback网址?如果设置Twilio将实时提交语音识别结果到此URL。如果您希望呼叫者说某些单词,这也值得添加提示,因为这可以加快识别速度。