我正在尝试确定AWS Lex是否使用AWS Transcribe进行即时确认。例如,Lex询问“您的电话号码是什么?”,用户回答为“ 1-2-3-4”。然后Lex问,“你是说1-2-3-4吗?”。 Lex在幕后使用什么作为ASR来确定用户说的“ 1-2-3-4”?是AWS Transcribe还是其他东西?
答案 0 :(得分:1)
除了AWS,我认为没有人知道,但是Lex使用AWS Transcribe
(和AWS Polly
背后的力量来从Lex返回语音)确实有意义。就个人经验而言,直到Transcribe在reInvent 17上宣布发表之前大约一个月,我一直在使用Lex
进行STT(语音到文本)。这样就可以了,因为intents
可能被忽略并传递给Lambda
处理程序。提供给Lambda
处理程序的JSON数据包包含已识别的语音(作为文本),我将其返回给调用者。但是,在他们宣布Transcribe
之后的某个时候,此操作停止了,因为intents
中的再也不能被忽略。除了intents
中的输入之外,任何其他输入都将返回配置的错误响应。
我的猜测是他们在启动Transcribe时就停止了这一操作。