我想通过一个在后端使用Python的Web浏览器应用程序捕获多个用户的音频。我需要分别处理来自不同用户的数据,然后根据该数据实时生成另一个音频流。
目前最好的方法是什么?一些潜在的方法:
- 是否可以使用现有的语音聊天客户端(例如Discord的API)并实时处理数据?
- 我查看了Twilio API,看来它们具有可在VoIP上运行的仅语音选项。可以使用MediaStream和Web套接字访问流数据。看来我需要一整组电话号码才能使用浏览器,每个用户一个?似乎也太贵了
- 我可以从头开始构建某些东西,可能使用Amazon Kinesis等流数据框架以及Web套接字吗?