标签: audio speech-recognition audio-streaming
我有音频文件,其中包含两个人之间的对话我想将音频文件拆分为两个音频文件,其中包含两个对话框的单独文件。 我想进一步使用这个音频文件的语音到文本。
或者
获取发言人关于每个人所说的对话的标签。
IBM提供了Speaker标签,但我想要的不是IBM。
有没有办法根据扬声器分割音频文件?
我想通过一些API或程序来做到这一点。