我想拥有自定义技能,但需要直接访问用户语音(录制音频的输出)。可以/将Alexa中继流而不是发送请求调用(启动/意图/会话结束)?
我理解自定义技能可以将mp3作为响应发送回来,但是能够获得对实际语音请求(流或mp3)的访问将是非常棒的。
修改
似乎请求对象中没有提供的mp3:https://developer.amazon.com/public/solutions/alexa/alexa-skills-kit/docs/alexa-skills-kit-interface-reference#LaunchRequest
答案 0 :(得分:11)
Alexa不提供此服务。
在家庭环境中拥有一个永远在线的设备,可以听到所说的一切,加上背景噪音和侧面对话,这是一个巨大的安全问题。亚马逊通过过滤输入,执行困难的语音到文本工作以及仅提供结果文本来缓解这种担忧。 (在您的交互模型进一步处理之后。)
答案 1 :(得分:-2)
简而言之,没有 - 我在文档中找不到任何具体内容,但我刚刚创建了一个封装所有JSON结构的Python库,所以我知道你还不能这样做。
对音频的唯一控制是通过在SSML中嵌入链接来“输出”。