我感兴趣的是一个源代码工具,它作为输入给出一个音频文件能够识别音频文件是否包含清晰的语音(背景中没有歌曲)。
答案 0 :(得分:1)
我怀疑这样的源代码是否存在。原因是你的任务没有精确定义。背景上的单鼓击打是否为背景上的一首歌?多次节拍是多少?如果弹钢琴怎么办?
理想情况下,您应该获得一些您想要区分的音乐样本,即不要尝试检测除了鼓之类的一些特定音乐风格的提示。
你可以训练一个GMM分类器来区分干净的语音和语音与背景音乐,但这是非常重要的任务。你需要一些训练数据来教电脑什么是歌曲,什么不是。
您可以在此处找到示例代码:https://github.com/danstowell/smacpy