我想用Qt进行实时音频处理,并使用FFTW3显示频谱。
我在步骤中做了什么:
我从计算机设备捕获任何声音并将其填入缓冲区。 我将声音样本分配给双数组 我计算基频。 当麦克风打开时我显示基本频率和磁力但没有信号(静音)时,基频不是我预期的,代码并不总是返回零,有时代码返回1500Hz,2000hz作为频率 当麦克风关闭(静音)时,代码不会返回零作为基准频率,而是返回0到9000Hz之间的数字。任何帮助都会受到赞赏 这是我的代码
QByteArray *buffer;
QAudioInput *audioInput;
audioInput = new QAudioInput(format, this);
//Check the number of samples in input buffer
qint64 len = audioInput->bytesReady();
//Limit sample size
if(len > 4096)
len = 4096;
//Read sound samples from input device to buffer
qint64 l = input->read(buffer.data(), len);
int input_size= BufferSize;
int output_size = input_size; //input_size/2+1;
fftw_plan p3;
double in[output_size];
fftw_complex out[output_size];
short *outdata = (short*)m_buffer.data();// assign sample into short array
int data_size = size_t(outdata);
int data_size1 = sizeof(outdata);
int count = 0;
double w = 0;
for(int i(chanelNumber); i < output_size/2; i= i + 2) //fill array in
{
w= 0.5 * (1 - cos(2*M_PI*i/output_size)); // Hann Windows
double x = 0;
if(i < data_size){
x = outdata[i];
}
if(count < output_size){
in[count] = x;// fill Array In with sample from buffer
count++;
}
}
for(int i=count; i<output_size; i++){
in[i] = 0;
}
p3 = fftw_plan_dft_r2c_1d(output_size, in, out, FFTW_ESTIMATE);// create Plan
fftw_execute(p3);// FFT
for (int i = 0; i < (output_size/2); i++) {
long peak=0;
double Amplitudemax=0;
double r1 = out[i][0] * out[i][0];
double im1 = out[i][3] * out[i][4];
double t1 = r1 + im1;
//double t = 20*log(sqrt(t1));
double t = sqrt(t1)/(double)(output_size/2);
double f = (double)i*8000 / ((double)output_size/2);
if(Magnitude > AmplitudeMax)
{
AmplitudeMax = Magnitude;
Peak =2* i;
}
}
fftw_destroy_plan(p3);
return Peak*(static_cast<double>(8000)/output_Size);
答案 0 :(得分:0)
你认为沉默可能包含一些微小的噪音。随机噪声的FFT也将是随机的,因此具有随机幅度峰值。但噪声可能来自环境中的设备或电子设备(风扇,反激变压器等),或ADC或麦克风的电源,从而显示出一些频率偏差。
如果噪声水平足够低,通常会检查幅度峰值的水平,将其与阈值进行比较,并切断低于此阈值的频率估算报告。