标签: python signal-processing source-separation
我正在做一些关于如何将音乐与广告分开以仅获取广告中提到的单词的研究。我使用librosa和pyaudio遇到了几种方法,其中讨论了设置高/低通滤波器的方法。我已经尝试过了,但是音乐仍然保留在广告中。
我要研究的另一种方法是说话人二分法。但是,我还不知道如何解决这个问题。可以使用一些深度学习架构,但是它们可能无法区分音乐和非音乐。
有人对此有更好的主意吗?
干杯, 安迪