如何从语音记录中找到min,max,mean,std dev pitch? 我使用AudioRecord录制我的声音。
frequency = 8000;
channelConfiguration = AudioFormat.CHANNEL_CONFIGURATION_MONO;
audioEncoding = AudioFormat.ENCODING_PCM_16BIT;
recordInstance = new AudioRecord(MediaRecorder.AudioSource.MIC,frequency, channelConfiguration, audioEncoding, bufferSize);
使用FFT算法处理语音原始数据并得到浮点数[]
使用此功能后:
private float[] spectrumAnalyz(float[] spectr) {
float Re;
float Im;
float[] spectruData = spectr;
float[] mySpectrum = new float[(spectruData.length / 2) - 1];
for (int i = 1, j = 0; i < spectruData.length / 2; i++, j++) {
Re = spectruData[2 * i];
Im = spectruData[2 * i + 1];
mySpectrum[j] = (float) Math.sqrt(Re * Re + Im * Im);
}
return mySpectrum;
}
此函数返回频率数组。在谷歌搜索后我发现了这个公式 http://en.wikipedia.org/wiki/Pitch_(music)
pitch = 69+12*log2(F/440Hz), where F is frequency in Hz.
使用这个公式我可以找到min,max,mean和std dev pitch。
一切都正确吗?
答案 0 :(得分:0)
FFT返回一组复杂幅度的数组,用于一堆选定的音频频谱频段。它不直接估计音调频率,因为音调不仅仅是频谱频率。
如果您使用音高检测或估算方法(加权自相关,倒谱,RAPT等),您引用的公式将为您提供该音高频率的MIDI编号。