我是音频信号处理,DFT,频谱图等方面的新手。几天前,我开始自己学习,现在,我尝试对在Python中学习的内容进行编码。我以任何方式使用
matplotlib.pyplot.specgram(x=data, Fs=rate, NFFT=512)
在我的代码中生成我的频谱图,然后我读了一篇关于有人在谈论使用Log-mel频谱图的文章。 我在网上搜索了频谱图和log-mel频谱图之间的区别,但没有找到满意的答案。 因此,我的第一个问题是频谱图和对数梅尔频谱图之间的区别是什么,第二个问题是我知道音频和NFFT参数之间存在关联,但是我真的不能说出如何选择最佳的NFFT。我的意思是,如果音频持续时间在2s和5s之间并且音频频率是44100 Hz,则NFFT应该是什么?如果音频频率为22050 Hz,则NFFT应该是多少? 因为我是所有这些的初学者,所以请尽量简化您的回答。