标签: c# microsoft-cognitive speech mfcc speaker
我正在写一个与语音相关的项目。我正在开发一种功能,以实时区分声音中人们的声音。 我使用Microsoft Azure Speaker Recognition API来区分人们的声音。
根据API指南,我必须上传WAV文件以接收音频并区分语音中的用户。 但是,我需要使用实时音频流来区分用户的声音。
所以我的问题是:如何使用实时音频流来实现说话人识别?
答案 0 :(得分:1)
当前版本的API(1.0)不支持音频流传输,但2.0版将支持此功能,该版本应在几个月内(2020年夏季)可用。