由于某种原因,频率被置换
391 hz => 1162
440 hz => 2196
493 hz => 2454
我正在使用此值
final int audioFrames= 1024;
final float sampleRate= 44100.0f;
final int bitsPerRecord= 16;
final int channels= 1;
final boolean bigEndian = true;
final boolean signed= true;
byteData= new byte[audioFrames * 2]; //two bytes per audio frame, 16 bits
dData= new double[audioFrames * 2]; // real & imaginary
这就是我准备数据并将其转换为双精度的方式:
format = new AudioFormat(sampleRate, bitsPerRecord, channels, signed, bigEndian);
DataLine.Info info = new DataLine.Info(TargetDataLine.class, format);
microphone = (TargetDataLine) AudioSystem.getLine(info);
microphone.open(format);
microphone.start();
int numBytesRead = microphone.read(byteData, 0, byteData.length);
读取数据后,从16位,big endian转换,签名为double
public void byteToDouble(){
ByteBuffer buf= ByteBuffer.wrap(byteData);
buf.order(ByteOrder.BIG_ENDIAN);
int i=0;
while(buf.remaining()>1){
short s = buf.getShort();
dData[ 2 * i ] = (double) s / 32768.0; //real
dData[ 2 * i + 1] = 0.0; // imag
++i;
}
}
最后,运行FFT并找到频率:
public void findFrequency(){
double frequency;
DoubleFFT_1D fft= new DoubleFFT_1D(audioFrames);
/* edu/emory/mathcs/jtransforms/fft/DoubleFFT_1D.java */
fft.complexForward(dData); // do the magic so we can find peak
for(int i = 0; i < audioFrames; i++){
re[i] = dData[i*2];
im[i] = dData[(i*2)+1];
mag[i] = Math.sqrt((re[i] * re[i]) + (im[i]*im[i]));
}
double peak = -1.0;
int peakIn=-1;
for(int i = 0; i < audioFrames; i++){
if(peak < mag[i]){
peakIn=i;
peak= mag[i];
}
}
frequency = (sampleRate * (double)peakIn) / (double)audioFrames;
System.out.print("Peak: "+peakIn+", Frequency: "+frequency+"\n");
}
答案 0 :(得分:0)
您可以在FFT结果区间(抛物线或Sinc插值)之间进行插值,以获得更准确的频率估计。但是你可能会遇到一个更大的问题:你的频率源可能会产生(或被剪切产生)一些非常强的奇次谐波或泛音,它们会掩盖FFT结果幅度中的任何基波正弦曲线。因此,您应该尝试使用音调检测/估计算法,而不是仅仅尝试寻找(可能缺失的)FFT峰值。
答案 1 :(得分:0)
首先,如果您录制的音频很长,则需要在块中进行FFT,最好在执行FFT之前对每个块进行加窗。 FFT仅计算一个基频,因此如果频率改变很多次,您需要在许多地方进行FFT。
滑动窗户也可以提高准确度。这意味着您将获取一个块,然后稍微滑动并取出另一个块,以便块重叠。您滑过多少是可变的,每个块的大小也是可变的。
然后,单独使用FFT可能会产生错误的结果。您可以对FFT产生的功率谱进行更多分析,如倒谱分析或谐波产品频谱分析,以更准确地估算音调。