我正在尝试构建Google Assistant应用,以识别从另一台设备(电视,广播等)播放的音频片段,并根据该音频片段采取措施以播放另一音频片段,YouTube视频或在浏览器中打开网站。
很高兴知道实现此功能的可能性,以及是否有我可以使用的可用Google资源/文章。
谢谢
答案 0 :(得分:2)
很抱歉通知您,到目前为止,您仍无法访问与Assistant交互的原始记录。您只会得到用户话语字符串。这意味着您无法制定识别音频剪辑的操作,只能在其中使用字符串(假设语音转文本引擎可以理解它们)
即使您使用字符串,也无法基于 ANY 输入打开网站或YouTube应用。因为与助手的交互是语音优先的。这意味着您不能总是假设用户有屏幕或已安装YouTube应用。如果交互是通过启用了助手的智能扬声器进行的,怎么办?
但是,您可以在单独的应用中录制用户的声音(或其他人的声音),然后使用SSML语法或“助手”的媒体响应来播放用户的声音。 Here's详细介绍了我的意思,并且可以实现。