我正在尝试通过从音乐中训练一个神经网络(已被用户本人标记为喜爱)来将音乐分类为可能喜欢或不太喜欢的应用程序。我之前从未做过音频分析,因此对此几乎一无所知。 要使其成为一个准确的分类模型,我需要在音乐数据集中包含哪些功能。 例如:-分贝值,频率值,音频长度
谢谢
答案 0 :(得分:1)
声谱图是一种有用的技术,用于可视化声音的频谱以及它们在非常短的时间内如何变化。您可以使用称为“ Mel-频率倒谱系数”(MFCC)的类似技术作为数据集的特征。
您可以使用Librosa's mfcc()函数,该函数根据时间序列音频数据生成MFCC,从而使任务更加轻松
答案 1 :(得分:0)
首先使用Essentia的音乐特征提取器。例如,您可以使用其commandline tool。这为您提供了大量的低级音频功能(30多种类型),节奏(6+多种特征类型)和音调(6+多种特征)。 您也可以对Python绑定执行相同的操作。