我的音频文件大小为1.25gb。
我的问题是当我尝试使用 librosa.feature.mfcc
获取功能时配置
SampleRate = 22050
Hop = 512
n_mfcc features = 40
运行需要几个小时
使用大量内存
我想知道是否有更好的更快/更轻松的方法来提取mfcc功能
最诚挚的问候
答案 0 :(得分:0)
MFCC功能是按帧计算的。如果您的跳数为512,则帧大小仅为1024或2048个值。因此,如果您流式传输AAC文件并加载M * frame大小的小型卡盘,则无需将其全部加载到内存中。
这可以使用Pysoundfile块处理来完成: https://pysoundfile.readthedocs.io/en/0.9.0/#block-processing
另一种方法是将文件分成NN个第二长文件,分别处理它们,然后将结果串联起来。