是否可以将实时数据发送到Azure Speaker Recognition API?

时间:2018-01-14 11:38:36

标签: c# microsoft-cognitive speech mfcc speaker

我正在写一个与语音相关的项目。我正在开发一种功能,以实时区分声音中人们的声音。 我使用Microsoft Azure Speaker Recognition API来区分人们的声音。

根据API指南,我必须上传WAV文件以接收音频并区分语音中的用户。 但是,我需要使用实时音频流来区分用户的声音。

所以我的问题是:如何使用实时音频流来实现说话人识别?

  1. 我是否可以使用Azure Speaker Recognition API获取实时音频,该API仅需要WAV文件?
  2. 或者除此API之外还有其他方法吗?

1 个答案:

答案 0 :(得分:1)

当前版本的API(1.0)不支持音频流传输,但2.0版将支持此功能,该版本应在几个月内(2020年夏季)可用。