AWS Transcribe>流式转录功能与用于实时流式音频的Kinesis Video Streams(用于音频输入)有什么区别

时间:2019-03-15 17:58:57

标签: amazon-web-services amazon-kinesis aws-transcribe amazon-kinesis-agent

嗨,我的要求是我有实时音频流作为输入,比如说两个人之间的通话,现在可以将音频转换为实时文本,并从提取的文本中选择某些关键字,然后插入数据库中。

根据 https://github.com/aws-samples/amazon-connect-realtime-transcription 中的架构,AWS Kinesis Video Streams服务和AWS Transcribe均用于实时流传输,但根据链接:https://aws.amazon.com/blogs/machine-learning/amazon-transcribe-now-supports-real-time-transcriptions/ AWS Transcribe支持实时转录,为什么Kinesis使用了哪种架构?

如果有人知道,请帮助我理解,希望Amazon connect可以将实时音频摄取到AWS Transcribe进行实时转录。

1 个答案:

答案 0 :(得分:2)

Amazon Kinesis Video Streams是启用来自Amazon Connect的流语音数据的服务。 Amazon Transcribe可以从任何来源获取流以进行实时转录,但是从Amazon Connect获取实时数据的唯一方法是通过Kinesis。 launch announcement for real-time streams可能有助于使这一点更加清楚:

  

借助客户语音流功能,您的客户音频是   自动发送到Amazon Kinesis Video Streams,可以在其中   由您允许的集成访问。例如,您可以   将客户语音流与实时文本转录集成在一起,   情绪分析可立即获得有关通话质量的反馈,或使用此功能   第三方语音生物识别产品的功能来验证   自动呼叫者,而无需输入密码或确认   个人信息。