我正在编写一个Unity3D插件,它从MP3文件中读取数据,将PCM数据提供给Unity,以便它可以在引擎内播放。在iOS上,我使用AVAssetReaderAudioMixOutput类来解码和读取数据,而在Android / Windows上,我使用FMOD。 我已经在Windows和iOS上设置了一个程序,它使用FMOD来播放音乐,就像Unity3D一样。 我无法在iOS和Windows上获得相同的结果,我似乎无法找到导致差异的音频输出设置/格式的差异。
首先,这些是我为输出音频流设置的设置,它们与Unity3D使用的设置相同:
FMOD_CREATESOUNDEXINFO exinfo2;
memset(&exinfo2, 0, sizeof(FMOD_CREATESOUNDEXINFO));
exinfo2.cbsize = sizeof(FMOD_CREATESOUNDEXINFO);
exinfo2.decodebuffersize = 44100;
exinfo2.length = 44100 * 1 * sizeof(float) * 100;
exinfo2.numchannels = 1;
exinfo2.defaultfrequency = 44100;
exinfo2.format = FMOD_SOUND_FORMAT_PCMFLOAT;
exinfo2.pcmreadcallback = pcmreadcallback;
result = system_->createStream("./1.mp3", FMOD_LOOP_NORMAL | FMOD_SOFTWARE | FMOD_OPENUSER | FMOD_CREATESTREAM, &exinfo2, &sound2_);
ERRCHECK(result);
result = system_->playSound(FMOD_CHANNEL_FREE,sound2_,false,0);
基本上,1通道,32位浮点PCM数据。这是在iOS和Windows播放程序上设置的。 现在,在iOS上,我设置了AVAssetReaderAudioMixOutput音频设置,如下所示:
NSDictionary *audioSetting = [NSDictionary dictionaryWithObjectsAndKeys:
[NSNumber numberWithFloat:44100.0],AVSampleRateKey,
[NSNumber numberWithInt:1],AVNumberOfChannelsKey, //how many channels has original?
[NSNumber numberWithInt:32],AVLinearPCMBitDepthKey, //was 16
[NSNumber numberWithInt:kAudioFormatLinearPCM], AVFormatIDKey,
[NSNumber numberWithBool:YES], AVLinearPCMIsFloatKey, //was NO
[NSNumber numberWithBool:0], AVLinearPCMIsBigEndianKey,
[NSNumber numberWithBool:NO], AVLinearPCMIsNonInterleaved,
[NSData data], AVChannelLayoutKey, nil];
我将PCMIsFloatKey设置为1,这样PCM数据就是一个浮点数,我将位深度设置为32,1通道,这样一切都与FMOD输出设置相匹配。
我读取数据并将其写入循环缓冲区:
float* convertedBuffer = (float * ) audioBufferList.mBuffers[0].mData;
//We don't need the audioconverter on iOS
//Fill up the circular buffer
for(int i = 0; i < numSamples; i++)
{
circularAudioBuffer_[bufferWritePosition_] = convertedBuffer[i];
bufferWritePosition_++;
if(bufferWritePosition_ >= circularBufferSize_)
bufferWritePosition_ = 0;
}
然后从缓冲区读取数据并将其写入pcmreadcallback中的音频流:
float *writeBuffer = (float *)data;
for(int i = 0; i < dataLength; i++)
{
sampleBuffer[i] = circularAudioBuffer_[bufferReadPosition_];
bufferReadPosition_++;
if(bufferReadPosition_ >= circularBufferSize_)
bufferReadPosition_ = 0;
}
这样,音频播放完美,循环缓冲区内的值范围为0.0-1.0f
现在,在Windows上,我初始化我从中读取数据的声音:
exinfo.cbsize = sizeof(FMOD_CREATESOUNDEXINFO);
exinfo.decodebuffersize = 44100;
exinfo.numchannels = 1;
exinfo.defaultfrequency = 44100;
exinfo.format = FMOD_SOUND_FORMAT_PCMFLOAT;
设置相同的参数:1channel,32bit浮点。我读取数据并将数据写入缓冲区:
FMOD_RESULT result = sound_->readData(rawBuffer, N4, &bytesRead);
float* floatBuffer = (float*) rawBuffer;
for(int j = 0; j < N; j++)
{
circularAudioBuffer_[bufferWritePosition_++] = floatBuffer[j];
if(bufferWritePosition_ >= circularBufferSize_)
bufferWritePosition_ = 0;
}
现在,当我读取数据时,我得到非常高或非常低的浮点值(大约1e34或-1e33)。在测试程序中,我无法在输出中听到任何声音。
我可以将输入和输出声音格式切换到PCM32,它在测试程序中可以正常播放,但在Unity3D中无法正常读取(它会发出很多声音,但我可以看出这首歌)。
任何人都可以帮我解决这个问题,并使用PCMFLOAT格式使其正常工作吗?谢谢!
TL; DR:我无法用PCMFLOAT格式从FMOD声音中读取数据!
答案 0 :(得分:0)
来自Fmod支持:Fmod Forums 指定的输出格式无关紧要。 FMod编解码器将始终返回PCM16,iOS编解码器将返回PCMFloats。所以,我需要转换它们:
(float)pcm16in[j] / 32768.0f;
除此之外,我(意外地)用MP3文件初始化输出流,这使得我无法改变输出格式。