从AvassetReader和vDSP_FFT获取iPhone的iPhone频率

时间:2011-05-02 14:37:50

标签: ios objective-c fft frequency pcm

我正试图通过iPhone / iPod音乐库获取iPod库上的频谱应用的频率,帮助自己reading-audio-samples-via-avassetreader获取音频样本,然后使用using-the-apple-fft-and-accelerate-frameworkApple vDSP Samples ,但不知怎的,我在某处错了,无法计算频率。

一步一步:

  • 读取音频样本
  • 汉宁窗口
  • 计算fft

这是从iPod mp3库获取频率的正确方法吗?

这是我的代码:

static COMPLEX_SPLIT    A;  
static FFTSetup         setupReal;  
static uint32_t         log2n, n, nOver2;  
static int32_t          stride;  
static float            *obtainedReal;  
static float            scale;  

+ (void)initialize  
{  
    log2n = 10;  
   n = 1 << log2n;  

    stride = 1;  
    nOver2 = n / 2;  
    A.realp = (float *) malloc(nOver2 * sizeof(float));  
    A.imagp = (float *) malloc(nOver2 * sizeof(float));  

    obtainedReal = (float *) malloc(n * sizeof(float));  
    setupReal = vDSP_create_fftsetup(log2n, FFT_RADIX2);  
}  


- (float) performAcceleratedFastFourierTransForAudioBuffer:(AudioBufferList)ioData   
{     
    NSUInteger * sampleIn = (NSUInteger *)ioData.mBuffers[0].mData;
    for (int i = 0; i < nOver2; i++) {
    double multiplier = 0.5 * (1 - cos(2*M_PI*i/nOver2-1));
        A.realp[i] = multiplier * sampleIn[i];
        A.imagp[i] = 0;
    }

    memset(ioData.mBuffers[0].mData, 0, ioData.mBuffers[0].mDataByteSize);  
    vDSP_fft_zrip(setupReal, &A, stride, log2n, FFT_FORWARD);  

    vDSP_zvmags(&A, 1, A.realp, 1, nOver2);           

    scale = (float) 1.0 / (2 * n);  

    vDSP_vsmul(A.realp, 1, &scale, A.realp, 1, nOver2);  
    vDSP_vsmul(A.imagp, 1, &scale, A.imagp, 1, nOver2);  

    vDSP_ztoc(&A, 1, (COMPLEX *)obtainedReal, 2, nOver2);  

    int peakIndex = 0;  
    for (size_t i=1; i < nOver2-1; ++i) {  
        if ((obtainedReal[i] > obtainedReal[i-1]) && (obtainedReal[i] > obtainedReal[i+1]))         
        {  
            peakIndex = i;  
            break;  
        }  
    }  

    //here I don't know how to calculate frequency with my data   
    float frequency = obtainedReal[peakIndex-1] / 44100 / n;

    vDSP_destroy_fftsetup(setupReal);  
    free(obtainedReal);  
    free(A.realp);  
    free(A.imagp);  

    return frequency;  
}  

我将1.4857571.332233作为我的第一个频率

1 个答案:

答案 0 :(得分:3)

在我看来,转换为FFT的复杂输入时存在问题。 vDSP_ctoz()分割缓冲区,其中实部和虚部被交织成两个缓冲区,一个是真实的,一个是虚构的。您对该函数的输入似乎只是已经转换为COMPLEX的实际数据。这意味着您到vDSP_ctoz()的输入缓冲区只需要它的一半长度,并且一些超出缓冲区大小的垃圾数据将被转换。

您需要创建sampleOut长度2*n并设置其他所有值(实际部分)或更好,您可以绕过vDSP_ctoz()直接复制输入将数据转换为A.realp并将A.imagp设置为零。只有在与产生交错复杂数据的源接口时才需要vDSP_ctoz()

修改

好吧,我认为我的第一个建议是错误的,因为vDSP文档说真实到复杂的就地fft的真实输入应格式化为分割复杂格式,以便imagp包含偶数样本和realp包含奇数样本。我实际上并没有使用过vDSP库,但我熟悉很多其他的FFT库,但我错过了这个细节。

您应该能够在调用A.realp后使用vDSP_zvmags(&A, 1, A.realp, 1, nOver2);找到峰值。此时,A.realp应包含FFT输出的幅度平方,即标量。如果要进行缩放,则应在mag2操作之前完成,但如果只是寻找峰值则可能不需要。

要获得FFT输出表示的实际频率,请使用以下公式:

F = (i * Fs) / N,   i=0,1,...,N/2

,其中

i是FFT输出缓冲区的索引 Fs是音频采样率 N是FFT长度

因此您的计算可能如下所示:

float frequency = (peakIndex * 44100) / n;

请记住,vDSP仅返回实际输入的输入频谱的前半部分,因为后半部分是冗余的。因此,FFT输出表示从0Fs/2的频率。

另一个注意事项是,我不知道您的峰值查找算法是否能够很好地工作,因为FFT输出不会很平滑,并且通常会有很多振荡。您只是采取第一个样本,其中两个相邻的样本较低。如果您只想找到一个峰值,那么最好只找到整个输出的最大幅度。如果你想找到多个峰值,你将不得不做一些更复杂的事情。