我使用TwilioML来收集用户的输入。
我所看到的是4-6秒的显着延迟。从用户停止讲话到我的服务(端点)被调用的时间。即使用非常简单的句子(例如我的名字是约翰)也会发生这种情况。
这是一个已知问题吗?从用户体验的角度来看,这不是一次很棒的体验。
我试图添加一个'填充物'通过但它没有任何影响,因为我可以开始它的早期是调用端点。 也许有一种方法可以在音频转换为文本的同时并行播放文件。
答案 0 :(得分:0)
'超时'属性设置Twilio将以秒为单位的限制 等待来电者按下另一个数字或说出另一个字 继续前进并向“行动”提出要求。 URL。例如,如果 '超时'是' 3',Twilio将等待三秒钟给来电者 在提交之前,按另一个键或说另一个单词 输入数字或语音到'动作' URL。 Twilio等到 在开始之前完成所有嵌套动词的执行 超时期限。
您看到延迟时间在4到6秒之间的事实可能是因为默认超时设置为5秒。
您是否尝试过使用partialResultCallback
网址?如果设置Twilio将实时提交语音识别结果到此URL。如果您希望呼叫者说某些单词,这也值得添加提示,因为这可以加快识别速度。