Question

我正在尝试使用jTransforms库对WAV文件进行频谱分析：Official Site

但是我在如何使用jTransforms将WAV文件转换为可接受的FFT输入方面存在问题，如何在FFT之后显示频谱？我在Google周围搜索过，发现我需要以某种方式将WAV文件转换为double[]或Complex[]，然后我应该如何解释输出？

抱歉，我对FFT很新，所以这个问题可能听起来非常愚蠢。非常感谢！

Answer 1

我不知道您的图书馆，但我猜他们有关于如何应用变换的大量文档。

关于解释，如果使用复数变换，您可以将实部解释为相应频率仓的能量，将虚数解释为正弦曲线的相位。功率谱密度（PSD）可以通过

计算

real(fftData)*conj(fftData)

等于

abs(fftData^2)

（所以将实部与它们的复共轭相乘）。

您可能需要考虑的一件事是重新调整您的fft输出。一些算法将输出与fftSize成比例缩放。所以你必须将输出乘以1 / fftSize。

最后一件事你不知道，你只需要取fft输出的一半，因为频谱是对称的。中间bin（fftSize / 2）通常是镜像基频，等于fftData [0]。这标志着奈奎斯特频率，这是您可以使用给定的fftSize分析的最高频率。因此，如果您想要显示高达22kHz的频率，请确保您的fftSize至少为44k。

FFT存在许多缺陷，因此请务必阅读一些部分并了解您在那里做了什么。如果你只想使用它，数学本身并不重要，所以你可以跳过它们。

编辑：还有更多。考虑使用锥形窗口（高斯，汉明，汉宁......）对输入数据进行加权，以避免在您不将整个wav文件作为输入提供时产生令人讨厌的边缘效应。否则，你的fft输出中会出现人为的高频，这些高频并不存在于原始声中。