我的目标是从.mp3中读取原始幅度与时间的数据,而无需先将其转换为.wav(以节省CPU上的内存)。我希望为100首歌曲运行此代码,而我负担不起保存所有这些.wav文件。
我知道pydub
是这样做的黄金标准。但是,raw_data是一个字节处理,我不知道该如何处理。这是我的代码。
song_name = "my_song"
sound = audio.from_mp3(song_name+'.mp3')
raw_data = sound.raw_data
sample_rate = sound.frame_rate
sample_size = sound.sample_width
channels = sound.channels
我希望包含两个通道的振幅数据的2D numpy数组。有提示吗?