没有相位信息的频谱图的逆STFT

时间:2018-04-11 22:22:20

标签: tensorflow fft spectrogram ifft

尝试训练神经网络处理音频数据,我想评估一些内部表示。其中一个是没有相位信息的幅度谱图,但是在Hann窗口之间有很高的重叠。

有没有办法可以使用tf.contrib.signal.inverse_stft从这个仅幅度谱图中生成音频信号?如果没有,是否有其他直接的方法(例如影响白噪声带通滤波器总和的东西)来做这个?

1 个答案:

答案 0 :(得分:1)

我对tf的inverse_stft了解不多;它似乎需要附加的窗口功能才能正常工作。

但是要从没有相位信息的STFT估计原始波形,您可能需要查看Griffin-Lim算法或以Mel频谱图为条件的WaveNet声码器(可以从STFT的线性频谱图得出)。

格里芬·林(Griffin-Lim)阿尔格:https://github.com/bkvogel/griffin_lim

WaveNet声码器:https://github.com/r9y9/wavenet_vocoder