我们可以从MFCC系数中恢复音频吗?

时间:2014-05-30 04:56:20

标签: audio speech-recognition

可以从MFCC系数中获取音频信号吗? MFCC系数也有一个值范围,如果是这样,它是什么,如果不是,你如何在0到1之间将其标准化。

我尝试使用以下MATLAB代码:

http://labrosa.ee.columbia.edu/matlab/rastamat/

但恢复的音频与原始信号不相似。

1 个答案:

答案 0 :(得分:3)

这个问题更适合dsp stackexchange

您无法修复MFCC的确切信号,它会丢弃一些信息,因此信号必须相似但不完全相同。通常它的质量较差。您可以在http://www.research.ibm.com/haifa/projects/multimedia/recovc/demo/index.html找到示例。

您始终可以将任何实值数据集标准化为0..1范围。一种方法是从实验数据中标准化std /变异。如果您的数据为x = {x1, x2, x3,....},那么您可以考虑(x_i - mean(x))/std(x)。第二种方法是应用任何映射函数,如arctan。通常不需要这种标准化。