从乐器中提取音频以找到音符

时间:2013-07-04 18:55:53

标签: android audio signal-processing frequency pitch

我正在尝试开发一款能够从乐器中提取音频的Android应用。我正在使用快速傅立叶变换方法和Jtransforms。以下是我到目前为止的情况:

public class MainActivity extends Activity {

@Override
protected void onCreate(Bundle savedInstanceState) {
    super.onCreate(savedInstanceState);
    setContentView(R.layout.activity_main);

    new readFrequencies().execute();
}

@Override
public boolean onCreateOptionsMenu(Menu menu) {
    // Inflate the menu; this adds items to the action bar if it is present.
    getMenuInflater().inflate(R.menu.main, menu);
    return true;
}

private class readFrequencies extends AsyncTask<Void,Integer,Integer> {

        @Override
        protected Integer doInBackground(Void... arg0) {
            AudioRecord recorder = null;
            int bufferSize = 0;
            boolean recording = true;

            int rate = 8000;
            short audioFormat = AudioFormat.ENCODING_PCM_16BIT;
            short channelConfig = AudioFormat.CHANNEL_IN_MONO;

            try {
                bufferSize = AudioRecord.getMinBufferSize(rate,channelConfig, audioFormat);

                recorder = new AudioRecord(AudioSource.DEFAULT, rate, 
                    channelConfig, audioFormat, bufferSize);

                if (recorder.getState() == AudioRecord.STATE_INITIALIZED) {
                    /*
                     *  Android 4.1.2
                     * 
                    int recorder_id = recorder.getAudioSessionId();
                    if (NoiseSuppressor.isAvailable()) NoiseSuppressor.create(recorder_id);
                    */
                }
                else {
                    Toast.makeText(getApplicationContext(), 
                            "Error en la inicialización", Toast.LENGTH_SHORT).show();
                }
            } catch (Exception e) {}

            short[] audioData = new short[bufferSize];

            if (recorder != null) {
                while (recording) {
                    if (recorder.getRecordingState() == AudioRecord.RECORDSTATE_STOPPED) {
                        recorder.startRecording();
                    }
                    else {
                        int numshorts = recorder.read(audioData,0,audioData.length);
                        if ((numshorts != AudioRecord.ERROR_INVALID_OPERATION) && 
                            (numshorts != AudioRecord.ERROR_BAD_VALUE)) {

                            //  Hann
                            double[] preRealData = new double[bufferSize];
                            double PI = 3.14159265359;
                            for (int i = 0; i < bufferSize; i++) {
                                double multiplier = 0.5 * (1 - Math.cos(2*PI*i/(bufferSize-1)));
                                preRealData[i] = multiplier * audioData[i];
                            }

                            DoubleFFT_1D fft = new DoubleFFT_1D(bufferSize);
                            double[] realData = new double[bufferSize * 2];

                            for (int i=0;i<bufferSize;i++) {
                                realData[2*i] = preRealData[i];
                                realData[2*i+1] = 0;    
                            }
                            fft.complexForward(realData);

                            double magnitude[] = new double[bufferSize / 2];

                            for (int i = 0; i < magnitude.length; i++) {
                                double R = realData[2 * i];
                                double I = realData[2 * i + 1];

                                magnitude[i] = Math.sqrt(I*I + R*R);
                            }

                            int maxIndex = 0;
                            double max = magnitude[0];
                            for(int i = 1; i < magnitude.length; i++) {
                                if (magnitude[i] > max) {
                                    max = magnitude[i];
                                    maxIndex = i;
                                }
                            }

                            int frequency = rate * maxIndex / bufferSize;
                            publishProgress(frequency);
                        }
                        else {
                            if (numshorts == AudioRecord.ERROR_BAD_VALUE) {
                                Toast.makeText(getApplicationContext(), 
                                        "ERROR_BAD_VALUE", Toast.LENGTH_SHORT).show();
                            }
                            else {
                                Toast.makeText(getApplicationContext(), 
                                        "ERROR_INVALID_OPERATION", Toast.LENGTH_SHORT).show();
                            }

                            return -1;
                        }
                    }
                }

                if (recorder.getState() == AudioRecord.RECORDSTATE_RECORDING) 
                    recorder.stop(); //stop the recorder before ending the thread
                recorder.release();
                recorder=null;
            }
            return 0;
        }

        protected void onProgressUpdate(Integer... f) {
            TextView texto = (TextView) findViewById(R.id.texto);
            texto.setText(String.valueOf(f[0]));
        }

        protected void onPostExecute(Integer f) {
            TextView texto = (TextView) findViewById(R.id.texto);
            int frecuencias = f.intValue();
            texto.setText(String.valueOf(frecuencias));
        }
}

}

使用此代码,我能够从产生纯信号的频率发生器获得准确的频率。但是,当我尝试使用乐器时,我会获得随机频率。我知道,当涉及真实乐器时,产生的信号包含可能影响最终结果的谐波,但我不知道在这种情况下获得实际频率。有人能帮助我吗?

我使用过TarsosDSP,我也尝试过自相关方法,但是我无法得到我想要的东西。

提前致谢。

2 个答案:

答案 0 :(得分:7)

频谱中最强大的频率分量与人类听众的感知音调之间存在巨大差异。

This academic paper可能是解决音高检测某些问题的方法的最终评论,但没有解决使用真实信号处理所需的感知问题。至少你需要考虑在音符的开头和结尾都跳八度的弦乐和风柱乐器以及缺少的基础知识。这将是Android上的特定乐透,其中设备上的麦克风在任何方面都不一致。

在频谱中搜索峰值频率并不比使用自相关更好,而且实际信号经常出错。

FFT方法(更准确地说,使用STFT和相位差的频率估计)可以工作,但只能进行大量的频谱后处理。一些商业色彩调谐器应用程序使用基于FFT的方法(我可以证明这一点已经写过)。

您可能希望了解Sonic Visualiser的某些功能提取插件如何解决此问题。

我还建议在这里回顾大量以前的问题几乎同样的事情 - 通常是提问者想要建立吉他调音器。

答案 1 :(得分:0)

对于它的价值 - 我相信乐器的电子调音器(例如吉他调音器等)并不是这样做的。他们不是像你一样做FFT,而是简单地测量波的周期 - (即零交叉之间的时间),然后计算周期的频率。