在Microsoft WebChat中控制文本到语音输出音频

时间:2020-03-19 07:37:44

标签: botframework direct-line-botframework web-chat

我正在使用Microsoft WebChat连接到我的Bot服务,并且大多数交互主要基于语音。我正在使用Azure语音服务,并且语音输出完全由WebChat处理。我当前正在向Bot发送不活动的事件,如果在设置的持续时间后未收到输入,它将提示不活动的用户。这是根据传入的活动完成的。但是,在语音驱动的情况下,有时会在Bot仍在讲话消息时发送该事件,因为即使消息未完全发出声音,也会基于接收到传入活动的时间发送不活动事件。我想在每条消息发出声音后的第二秒发送不活动的提示,但是为此,我需要知道每条消息的播放持续时间。有没有一种方法可以获取文本语音转换服务提供的每条语音消息的输出持续时间,以便我可以在正确的时间发送不活动的提示?

1 个答案:

答案 0 :(得分:1)

目前,对于网络聊天,无法捕获语音持续时间。如果您希望看到此内容,我建议将其作为功能要求提交以供将来开发。您可以here这样做。

是认知服务的一种功能,它通过其REST API(请参阅here),并且似乎是通过SDK(请参见here)。您可以将语音STT / TTS直接集成到您的项目中,以便利用响应对象中可用的“ duration”属性。

希望有帮助!