具有fmod的PCM数据格式 - 在多个平台上的差异

时间:2013-08-16 20:45:38

标签: audio audio-streaming pcm fmod

我正在编写一个Unity3D插件,它从MP3文件中读取数据,将PCM数据提供给Unity,以便它可以在引擎内播放。在iOS上,我使用AVAssetReaderAudioMixOutput类来解码和读取数据,而在Android / Windows上,我使用FMOD。 我已经在Windows和iOS上设置了一个程序,它使用FMOD来播放音乐,就像Unity3D一样。 我无法在iOS和Windows上获得相同的结果,我似乎无法找到导致差异的音频输出设置/格式的差异。

首先,这些是我为输出音频流设置的设置,它们与Unity3D使用的设置相同:

FMOD_CREATESOUNDEXINFO   exinfo2;
memset(&exinfo2, 0, sizeof(FMOD_CREATESOUNDEXINFO));
exinfo2.cbsize            = sizeof(FMOD_CREATESOUNDEXINFO);             
exinfo2.decodebuffersize  = 44100;                                  
exinfo2.length            = 44100 * 1 * sizeof(float) * 100;            
exinfo2.numchannels       = 1;                                          
exinfo2.defaultfrequency  = 44100;                                  
exinfo2.format            = FMOD_SOUND_FORMAT_PCMFLOAT;         
exinfo2.pcmreadcallback   = pcmreadcallback;                          
result = system_->createStream("./1.mp3", FMOD_LOOP_NORMAL | FMOD_SOFTWARE | FMOD_OPENUSER | FMOD_CREATESTREAM, &exinfo2, &sound2_);
ERRCHECK(result);
result = system_->playSound(FMOD_CHANNEL_FREE,sound2_,false,0);

基本上,1通道,32位浮点PCM数据。这是在iOS和Windows播放程序上设置的。 现在,在iOS上,我设置了AVAssetReaderAudioMixOutput音频设置,如下所示:

NSDictionary *audioSetting = [NSDictionary dictionaryWithObjectsAndKeys:
                                  [NSNumber numberWithFloat:44100.0],AVSampleRateKey,
                                  [NSNumber numberWithInt:1],AVNumberOfChannelsKey,    //how many channels has original?
                                  [NSNumber numberWithInt:32],AVLinearPCMBitDepthKey, //was 16
                                  [NSNumber numberWithInt:kAudioFormatLinearPCM], AVFormatIDKey,
                                  [NSNumber numberWithBool:YES], AVLinearPCMIsFloatKey,  //was NO
                                  [NSNumber numberWithBool:0], AVLinearPCMIsBigEndianKey,
                                  [NSNumber numberWithBool:NO], AVLinearPCMIsNonInterleaved,
                                  [NSData data], AVChannelLayoutKey, nil];

我将PCMIsFloatKey设置为1,这样PCM数据就是一个浮点数,我将位深度设置为32,1通道,这样一切都与FMOD输出设置相匹配。

我读取数据并将其写入循环缓冲区:

        float* convertedBuffer = (float * ) audioBufferList.mBuffers[0].mData;
        //We don't need the audioconverter on iOS
        //Fill up the circular buffer
        for(int i = 0; i < numSamples; i++)
        {
            circularAudioBuffer_[bufferWritePosition_] = convertedBuffer[i];
            bufferWritePosition_++;
            if(bufferWritePosition_ >= circularBufferSize_)
                bufferWritePosition_ = 0;

        }

然后从缓冲区读取数据并将其写入pcmreadcallback中的音频流:

float *writeBuffer = (float *)data;
for(int i = 0; i < dataLength; i++)
{
    sampleBuffer[i] = circularAudioBuffer_[bufferReadPosition_];
    bufferReadPosition_++;
    if(bufferReadPosition_ >= circularBufferSize_)
        bufferReadPosition_ = 0;
}

这样,音频播放完美,循环缓冲区内的值范围为0.0-1.0f

现在,在Windows上,我初始化我从中读取数据的声音:

exinfo.cbsize            = sizeof(FMOD_CREATESOUNDEXINFO);             
exinfo.decodebuffersize  = 44100;
exinfo.numchannels       = 1;
exinfo.defaultfrequency  = 44100;            
exinfo.format            = FMOD_SOUND_FORMAT_PCMFLOAT;  

设置相同的参数:1channel,32bit浮点。我读取数据并将数据写入缓冲区:

    FMOD_RESULT result = sound_->readData(rawBuffer, N4, &bytesRead);

    float* floatBuffer = (float*) rawBuffer;
    for(int j = 0; j < N; j++)
    {
        circularAudioBuffer_[bufferWritePosition_++] = floatBuffer[j];
        if(bufferWritePosition_ >= circularBufferSize_)
            bufferWritePosition_ = 0;
    }

现在,当我读取数据时,我得到非常高或非常低的浮点值(大约1e34或-1e33)。在测试程序中,我无法在输出中听到任何声音。

我可以将输入和输出声音格式切换到PCM32,它在测试程序中可以正常播放,但在Unity3D中无法正常读取(它会发出很多声音,但我可以看出这首歌)。

任何人都可以帮我解决这个问题,并使用PCMFLOAT格式使其正常工作吗?谢谢!

TL; DR:我无法用PCMFLOAT格式从FMOD声音中读取数据!

1 个答案:

答案 0 :(得分:0)

来自Fmod支持:Fmod Forums 指定的输出格式无关紧要。 FMod编解码器将始终返回PCM16,iOS编解码器将返回PCMFloats。所以,我需要转换它们:

(float)pcm16in[j] / 32768.0f;

除此之外,我(意外地)用MP3文件初始化输出流,这使得我无法改变输出格式。