我正在研究Python中的音频文件分析,特别是音乐音频,我已经应用了DFT(FFT)来获取频域中的数据,但是没有任何数量的搜索或摆弄它已经揭示了识别频率中“峰值”/局部最大值的好方法。我的数据非常嘈杂,应用傅立叶变换后的图形示例如下。帮助将非常感激。我也在考虑从这些数据中检索MFCC系数,但我也不确定如何去做,因此有关该主题的知识也很有用。
答案 0 :(得分:0)
首先,您需要通过运行低通滤波来平滑您的(fft)数据。之后,您可以在信号的梯度上找到零交叉。您可以使用[-1,1]过滤信号以查找渐变,并选择前一个为正且后继为负的元素。