Librosa生成大量MFCC特征数组

时间:2018-11-03 16:00:20

标签: arrays audio mfcc librosa

我的音频文件大小为1.25gb。

我的问题是当我尝试使用 librosa.feature.mfcc

获取功能时

配置

SampleRate = 22050
Hop = 512
n_mfcc features = 40 
  1. 运行需要几个小时

  2. 使用大量内存

我想知道是否有更好的更快/更轻松的方法来提取mfcc功能

最诚挚的问候

1 个答案:

答案 0 :(得分:0)

MFCC功能是按帧计算的。如果您的跳数为512,则帧大小仅为1024或2048个值。因此,如果您流式传输AAC文件并加载M * frame大小的小型卡盘,则无需将其全部加载到内存中。

这可以使用Pysoundfile块处理来完成: https://pysoundfile.readthedocs.io/en/0.9.0/#block-processing

另一种方法是将文件分成NN个第二长文件,分别处理它们,然后将结果串联起来。