我一直在寻求音频分析。我有一个WAV流读入内存,我需要对数据执行各种功能,如FFT。我一直在阅读理论,但我不确定我是否正确阅读。在读取流时,我得到一堆数字输出,我猜是采样数据(44100赫兹)。我是否在这个流上执行所有功能?那么,对于1024个样本的窗口,我只是从流中获取前1024个数字吗?然后我在这个1024集上执行FFT和所有其他函数并重复其余的流吗?
我开始理解它的理论,以及总结样本等的想法......但我不确定这在实现术语中意味着什么。
编辑 - 为了澄清我得到的流值,数字沿-0.432,-0.065...
行。
答案 0 :(得分:2)
这只是您可以做的简要概述。有关详细信息,我建议您查看一些文献。
在应用FFT之前,需要对音频信号进行预处理或加窗。 假设您正在开窗(汉宁等), 窗口函数将应用于具有一些“重叠”的原始音频以处理边缘效果。例如,您可以采用1024个方便的窗口大小。窗口化后,您可以按1024(预处理)样本进行FFT。
我建议你使用MATLAB。这将使你的任务变得简单。