梅尔-频谱图大小

时间:2019-11-08 05:35:46

标签: python neural-network signal-processing voice-recognition librosa

我正在使用Python中的Librosa从GTZAN数据集中提取对数梅尔-频谱图。我的代码-

data, sampling_rate = librosa.load(os.path.join(dir, folder, file), )
mel = librosa.feature.melspectrogram(y=data, hop_length = 512//2, n_fft = 512, n_mels = 64)
mel = librosa.power_to_db(mel**2)

好吧,它运作完美。但是,每个梅尔谱图的大小是不同的。大部分对数梅尔频谱图的大小为2586,其中一些具有2590至2620。

我登录梅尔谱图时检查大小是否不同。当所有音频都在相同长度时,记录日志时它们的大小如何不同...

任何建议,谢谢

0 个答案:

没有答案