我一直在研究Android项目一段时间,它显示输入信号的基频(充当调谐器)。我已经成功实现了AudioRecord类并从中获取数据。但是,我很难对这些数据执行FFT以获得输入信号的基频。我一直在查看帖子here,并使用FFT in Java和Complex class来使用它。
我已经成功使用了Java中FFT中的FFT函数,但我不确定我是否获得了正确的结果。对于FFT的幅度(sqrt [re re + im im]),我得到的值开始高,大约15000赫兹,然后慢慢减小到大约300赫兹。似乎不对。
另外,就麦克风的原始数据而言,数据似乎很好,除了前50个值左右总是数字3,除非我在应用程序中再次点击调整按钮然后我只得到15左右。这是正常的吗?
这是我的一些代码。
首先,我使用来自post I have been looking at的以下代码将短数据(从麦克风获得)转换为double。这段代码我不完全理解,但我认为它有效。
//Conversion from short to double
double[] micBufferData = new double[bufferSizeInBytes];//size may need to change
final int bytesPerSample = 2; // As it is 16bit PCM
final double amplification = 1.0; // choose a number as you like
for (int index = 0, floatIndex = 0; index < bufferSizeInBytes - bytesPerSample + 1; index += bytesPerSample, floatIndex++) {
double sample = 0;
for (int b = 0; b < bytesPerSample; b++) {
int v = audioData[index + b];
if (b < bytesPerSample - 1 || bytesPerSample == 1) {
v &= 0xFF;
}
sample += v << (b * 8);
}
double sample32 = amplification * (sample / 32768.0);
micBufferData[floatIndex] = sample32;
}
然后代码继续如下:
//Create Complex array for use in FFT
Complex[] fftTempArray = new Complex[bufferSizeInBytes];
for (int i=0; i<bufferSizeInBytes; i++)
{
fftTempArray[i] = new Complex(micBufferData[i], 0);
}
//Obtain array of FFT data
final Complex[] fftArray = FFT.fft(fftTempArray);
final Complex[] fftInverse = FFT.ifft(fftTempArray);
//Create an array of magnitude of fftArray
double[] magnitude = new double[fftArray.length];
for (int i=0; i<fftArray.length; i++){
magnitude[i]= fftArray[i].abs();
}
fft.setTextColor(Color.GREEN);
fft.setText("fftArray is "+ fftArray[500] +" and fftTempArray is "+fftTempArray[500] + " and fftInverse is "+fftInverse[500]+" and audioData is "+audioData[500]+ " and magnitude is "+ magnitude[1] + ", "+magnitude[500]+", "+magnitude[1000]+" Good job!");
for(int i = 2; i < samples; i++){
fft.append(" " + magnitude[i] + " Hz");
}
最后一点只是检查我得到的值(并让我保持理智!)。在上面提到的帖子中,它讨论了需要采样频率并给出这段代码:
private double ComputeFrequency(int arrayIndex) {
return ((1.0 * sampleRate) / (1.0 * fftOutWindowSize)) * arrayIndex;
}
如何实现此代码?我真的不明白fftOutWindowSize和arrayIndex来自何处?
非常感谢任何帮助!
达斯汀
答案 0 :(得分:3)
最近我正在开展一个几乎相同的项目。可能你不再需要任何帮助,但无论如何我都会提出我的想法。也许有人在将来需要这个。
"double[] micBufferData = new double[bufferSizeInBytes];"
我认为micBufferData
的大小应该是“bufferSizeInBytes / 2
”,因为每个样本都需要两个字节,micBufferData
的大小应该是样本号。要使用最后给出的代码,首先应该在样本数组中找到峰值索引。我使用double数组作为输入而不是Complex,所以在我的例子中它类似于:double maxVal = -1;int maxIndex = -1;
for( int j=0; j < mFftSize / 2; ++j ) {
double v = fftResult[2*j] * fftResult[2*j] + fftResult[2*j+1] * fftResult[2*j+1];
if( v > maxVal ) {
maxVal = v;
maxIndex = j;
}
}
2 * j是实部,2 * j + 1是虚部。 maxIndex
是您想要的峰值幅度的索引(更详细here),并将其用作ComputeFrequency
函数的输入。返回值是您想要的样本数组的频率。
希望它可以帮助别人。
答案 1 :(得分:2)
您应该根据时间与频率分辨率要求选择FFT窗口大小,而不是仅在创建FFT温度阵列时使用音频缓冲区大小。
数组索引是你的int i,在magnitude [i] print语句中使用。
音乐的基本音高频率通常与FFT峰值幅度不同,因此您可能需要研究一些音高估计算法。
答案 2 :(得分:2)
我怀疑你得到的奇怪结果是因为你可能需要解压缩FFT。如何完成这将取决于您正在使用的库(例如,请参阅here以获取有关如何在GSL中打包的文档)。打包可能意味着实部和虚部不在您期望的数组中的位置。
关于窗口大小和分辨率的其他问题,如果您正在创建调谐器,那么我建议尝试大约20ms的窗口大小(例如,44.1kHz处的1024个样本)。对于调谐器,你需要相当高的分辨率,所以你可以尝试零填充8或16倍,这将给你3-6Hz的分辨率。