我正在尝试使用SDL2和FFTW3在C ++中创建音乐可视化器。 我的目标是加载.wav音频文件,然后同时播放音频并使用SDL2回调函数执行实时快速傅立叶变换。 我想得到频谱数据,以便我可以在以后实现图形可视化。
我按照SDL YouTube指南加载.wav并使用回调功能播放音频,但我不明白如何对此数据执行FFT。我遵循了另一个关于使用FFT和SDL与C产生类似效果的指南,但我仍然不确定如何实际实现它。
Uint8* sampData;
SDL_AudioSpec wavSpec;
Uint8* wavStart;
Uint32 wavLength;
SDL_AudioDeviceID aDevice;
struct AudioData {
Uint8* filePosition;
Uint32 fileLength;
};
void PlayAudioCallback(void* userData, Uint8* stream, int streamLength) {
AudioData* audio = (AudioData*)userData;
sampData = new Uint8;
if (audio->fileLength == 0) {
return;
}
Uint32 length = (Uint32)streamLength;
length = (length > audio->fileLength ? audio->fileLength : length);
SDL_memcpy(stream, audio->filePosition, length);
// HERE is where i'd like to implement the FFT on 'stream' data
// but i don't know how to implement this using FFTW
audio->filePosition += length;
audio->fileLength -= length;
}
int main() {
SDL_Init(SDL_INIT_AUDIO);
// Load .wav file
if (SDL_LoadWAV(FILE_PATH, &wavSpec, &wavStart, &wavLength) == NULL) {
cerr << "Couldnt load file: " << FILE_PATH << endl;
getchar();
}
cout << "Loaded " << FILE_PATH << endl;
AudioData audio;
audio.filePosition = wavStart;
audio.fileLength = wavLength;
wavSpec.callback = PlayAudioCallback;
wavSpec.userdata = &audio;
// Open audio playback endpoint
aDevice = SDL_OpenAudioDevice(NULL, 0, &wavSpec, NULL, SDL_AUDIO_ALLOW_ANY_CHANGE);
if (aDevice == 0) {
cerr << "Audio Device connection failed: " << SDL_GetError() << endl;
getchar();
}
// Play audio on playback endpoint
SDL_PauseAudioDevice(aDevice, 0);
// Do nothing while there's still data to be played
while (audio.fileLength > 0) {
SDL_Delay(100);
}
}
根据以前的经验,我使用NumPy将.wav数据解压缩到NumPy数组中,然后发送内置的NumPy-FFT函数,但我对如何处理我在这里的SDL流数据毫无头绪。
答案 0 :(得分:2)
你想要的是短期FFT。您可以从流中收集样本缓冲区,并在执行FFT之前将窗函数应用于样本。然后,您收集另一个缓冲区,保留第一个缓冲区中的一些样本并附加新样本。重复,直到处理完所有数据。
由于您的输入数据是实数,因此FFT是对称的,因此您只需要第一个N / 2 + 1复数输出区。这些代表来自直流电的频率。到Fs / 2。拿出他们的数量和情节。重复每个FFT。