语音/音乐分类

时间:2012-06-07 06:33:57

标签: audio signal-processing speech

我想确定哪个音频文件包含语音或音乐。

我希望某人有这样的东西,或者可以告诉我从哪里开始。 你能否提出一些方法/教程来做同样的事情。

谢谢。

2 个答案:

答案 0 :(得分:5)

查看the pyAudioAnalysis python库。其中,它具有预训练的语音分类器和两种分段分类方法(一种基于固定大小的窗口,另一种基于HMM)。

您可以非常轻松地提取录音的语音和音乐部分,例如:

from pyAudioAnalysis import audioSegmentation as aS [flagsInd, classesAll, acc] = aS.mtFileClassification("data/scottish.wav", "data/svmSM", "svm", True, 'data/scottish.segments')

结果为this image

中的结果

答案 1 :(得分:2)

这个领域有很多现有技术,但我建议浏览一些Dan Ellis's篇论文。 this talk的幻灯片有一些很好的背景。简而言之,一切都取决于选择正确的特征向量。