任务:实时从音频中识别歌曲
流程:
- 前端(Chrome浏览器)会持续记录一段固定的音频持续时间。
- 一旦音频剪辑准备就绪(例如1秒),它就会发送到后端。
- 后端将为每个客户端创建一个队列,并在专用线程中逐个处理传入的音频剪辑。
- 一旦对歌曲的匹配充满信心,就会以歌曲的详细信息做出回应。
我面临的问题: 到目前为止,我一直在用python中的flask一次识别长时间音频中的歌曲。音频剪辑已作为POST请求正文的一部分发送。当为多个客户端部署时,这可以完美地工作。
但是现在我对如何部署“实时”功能一无所知,因为它似乎比仅处理RESTful POST API要复杂得多。
目前的努力: 我正在使用SocketIO和Flask来创建与客户端的套接字连接。音频剪辑正在通过此套接字发送,并且在后端创建了一个线程来处理这些传入文件。我能够成功实现该功能(歌曲识别有效!!),但是它存在很多错误,无法正确处理多个客户端,并且在连接和断开套接字时出现问题。
请为我提供正确的python模块和部署架构。