嗨,我的要求是我有实时音频流作为输入,比如说两个人之间的通话,现在可以将音频转换为实时文本,并从提取的文本中选择某些关键字,然后插入数据库中。
根据 https://github.com/aws-samples/amazon-connect-realtime-transcription 中的架构,AWS Kinesis Video Streams服务和AWS Transcribe均用于实时流传输,但根据链接:https://aws.amazon.com/blogs/machine-learning/amazon-transcribe-now-supports-real-time-transcriptions/ AWS Transcribe支持实时转录,为什么Kinesis使用了哪种架构?
如果有人知道,请帮助我理解,希望Amazon connect可以将实时音频摄取到AWS Transcribe进行实时转录。
答案 0 :(得分:2)
Amazon Kinesis Video Streams是启用来自Amazon Connect的流语音数据的服务。 Amazon Transcribe可以从任何来源获取流以进行实时转录,但是从Amazon Connect获取实时数据的唯一方法是通过Kinesis。 launch announcement for real-time streams可能有助于使这一点更加清楚:
借助客户语音流功能,您的客户音频是 自动发送到Amazon Kinesis Video Streams,可以在其中 由您允许的集成访问。例如,您可以 将客户语音流与实时文本转录集成在一起, 情绪分析可立即获得有关通话质量的反馈,或使用此功能 第三方语音生物识别产品的功能来验证 自动呼叫者,而无需输入密码或确认 个人信息。