标签: audio machine-learning deep-learning
我想制作一个说话人识别系统。我不想使用深度学习,因为它可能需要大量数据。我可以使用上面提到的音频组件实现它吗?
答案 0 :(得分:1)
在所有情况下,如果您想“识别”扬声器,则需要数据学习。经典方法基于MFCC计算和kMeans的分类(或更精细的GMMs)。
你会发现here概述LIUM的完整系统,用于说话人员的分类(更复杂)。