我正在使用Python中的Librosa从GTZAN数据集中提取对数梅尔-频谱图。我的代码-
data, sampling_rate = librosa.load(os.path.join(dir, folder, file), )
mel = librosa.feature.melspectrogram(y=data, hop_length = 512//2, n_fft = 512, n_mels = 64)
mel = librosa.power_to_db(mel**2)
好吧,它运作完美。但是,每个梅尔谱图的大小是不同的。大部分对数梅尔频谱图的大小为2586,其中一些具有2590至2620。
我登录梅尔谱图时检查大小是否不同。当所有音频都在相同长度时,记录日志时它们的大小如何不同...
任何建议,谢谢