应用错误收集

是否可以将实时数据发送到Azure Speaker Recognition API？

时间：2018-01-14 11:38:36

标签： c# microsoft-cognitive speech mfcc speaker

我正在写一个与语音相关的项目。我正在开发一种功能，以实时区分声音中人们的声音。我使用Microsoft Azure Speaker Recognition API来区分人们的声音。

根据API指南，我必须上传WAV文件以接收音频并区分语音中的用户。但是，我需要使用实时音频流来区分用户的声音。

所以我的问题是：如何使用实时音频流来实现说话人识别？

我是否可以使用Azure Speaker Recognition API获取实时音频，该API仅需要WAV文件？
或者除此API之外还有其他方法吗？

1 个答案:

答案 0 :(得分：1)

当前版本的API（1.0）不支持音频流传输，但2.0版将支持此功能，该版本应在几个月内（2020年夏季）可用。