WASAPI环回:保存波形文件

时间:2015-06-07 10:47:23

标签: c++ wav file-format wasapi audioformat

我想使用WASAPI录制系统的音频输出,然后将其保存为.wav文件。

到目前为止,我已经在WASAPI上关注了这些指南:

https://msdn.microsoft.com/en-us/library/windows/desktop/dd316551%28v=vs.85%29.aspx https://msdn.microsoft.com/en-us/library/windows/desktop/dd370800%28v=vs.85%29.aspx

我使用

获取缓冲区数据
audioCaptureClient->GetBuffer(&data, &numFramesAvailable, &flags, NULL, NULL);

然后,我只是在.wav文件的末尾写下这些数据:

size_t dataSize = format.nChannels * (format.wBitsPerSample / 8) * numFramesAvailable;
fwrite(data, dataSize, 1, fp);

format是从WAVEFORMATEX收到的audioClient->GetMixFormat(&format)

cbSize:          22
nAvgBytesPerSec: 352800
nBlockAlign:     8
nChannels:       2
nSamplesPerSec:  44100
wBitsPerSample:  32
wFormatTag:      65534 (WAVE_FORMAT_EXTENSIBLE)

显然WAVE_FORMAT_EXTENSIBLE的子类型是Float:

WAVEFORMATEXTENSIBLE *waveformatextensible = (WAVEFORMATEXTENSIBLE *)format;
if (IsEqualGUID(KSDATAFORMAT_SUBTYPE_IEEE_FLOAT, waveformatextensible->SubFormat)) { // true

在将所有捕获的数据写入文件之前,我填写标题(http://www.topherlee.com/software/pcm-tut-wavformat.html之后):

UINT32 sizePlaceholder = 0;
UINT32 fmtLength = 16;

// RIFF Header
fputs("RIFF", fp);                       // offset 0 (0x00)
fwrite(&sizePlaceholder, 4, 1, fp);      // offset 4 (0x04)
fputs("WAVE", fp);                       // offset 8 (0x08)
// fmt-Section
fputs("fmt ", fp);                         // offset 12 (0x0C)
fwrite(&fmtLength, 4, 1, fp);              // offset 16 (0x10)
fwrite(&format.wFormatTag, 2, 1, fp);      // offset 20 (0x14)
fwrite(&format.nChannels, 2, 1, fp);       // offset 22 (0x16)
fwrite(&format.nSamplesPerSec, 4, 1, fp);  // offset 24 (0x18)
fwrite(&format.nAvgBytesPerSec, 4, 1, fp); // offset 28 (0x1C)
fwrite(&format.nBlockAlign, 2, 1, fp);     // offset 32 (0x20)
fwrite(&format.wBitsPerSample, 2, 1, fp);  // offset 34 (0x22)
// Data-Section
fputs("data", fp);                         // offset 36 (0x24)
fwrite(&sizePlaceholder, 4, 1, fp);        // offset 40 (0x28)

写完3秒数据后,我使用fwrite填写文件大小和数据部分大小的占位符。

该文件无法读取。我怀疑它与WAVE_FORMAT_EXTENSIBLE有关,但我无法弄明白。

我尝试覆盖format的几个元素,如:

cbSize = 0;
wFormatTag = WAVE_FORMAT_IEEE_FLOAT;

制作一个可读的.wav文件,但只需点击一下即可播放(我试着录制一首歌)。

wFormatTag = WAVE_FORMAT_PCM;

产生所有随机噪音。

1 个答案:

答案 0 :(得分:1)

所以,经过长时间的实验,我找到了解决方案。

代码存在多个问题。

  1. WAVE_FORMAT_EXTENSIBLE使用文件布局,略有不同。有关更多详细信息,请参阅此link
  2. 我没有在fopen中设置二进制模式,因此音频数据已损坏,因为fwrite检测到数据中的换行符(\n)并添加回车符{{1 }})。我必须使用\r而不是fopen("foo.wav", "wb")
  3. 第二个问题是决定性的原因,因为我已经尝试将fopen("foo.wav", "w") - 标签替换为WAVE_FORMAT_EXTENSIBLE - 标签,这应该有效,因为a不需要额外的信息。 wav文件工作。