有没有人知道是否有AWS API或类似内容允许我发送文本(或SSML),并取回Alexa'发言'的音频。
至关重要的是,我想要Alexa的'声音'中的输出
我到目前为止探讨的选项是:
SpeechletResponse
有OutputSpeech
包含插槽的值。 AWS API网关配置为调用lambda并返回结果
我没试过这个,但我猜测通过API网关返回我的客户端的结果将是SpeechletResponse
的json表示而不是音频流。javaclient
的{{1}}部分,但我不知道我是不是正在咆哮错误的树
我已经创建了一个AVS产品,我已经配置了alexa-avs-sample-app
来与之交谈
目前它的交互是基于从我的麦克风到音频流采样音频流,并将其发送到AVS(即,好像我已经说过我的Echo)
所以我可以说“告诉mySkill说'你好世界'”它会说“你好世界”
但这不是我想要的 - 我不想说什么,我想以编程方式调用带有一些文本的API来获取语音音频流。已经问过similar question,但目前没有答案,我想我已经为我的特定问题添加了更多细节/分析。
在回复其中一条评论时,我会尝试描述我想要Alexa声音的具体用例:
在开发Alexa技能时,您可以在lambda函数中的代码中构造并填充javaclient
。在部署lambda之前,无法听到语音输出的声音,并在真实设备上进行测试,或者使用开发人员门户的“测试”选项卡的“语音模拟器”部分。
我试图解决的问题是为Alexa技能创建良好的声音语音响应,而没有上述的试错法。部署和使用真实设备显然是漫长的。使用语音模拟器是更好的,但它的局限性在于你有一个非常小的字段可以操作(如果你有一个长句或你想说的段落就不好),并且添加SSML来增强语音输出不是一个伟大的用户体验和工作流程。
我正在寻找能够改进这个用户体验和工作流程的东西,但其背后的核心要求是听到Alexa的声音。是的,当然我可以使用Polly,但是如果这个用例是让Alexa技能更容易写,那么听到另一个声音并没有多大用处,可以说是误导,因为不同的声音发出不同的单词和标点符号的方式是不同的,所以你可能需要为一个声音的某些单词添加SSML语音,但不能为另一个声音添加。