C ++读取16位Wav文件

时间:2013-09-12 18:05:51

标签: c++ audio wav

我在阅读16位.wav文件时遇到问题。我已阅读标题信息,但转换似乎不起作用。

例如,在Matlab中,如果我在波形文件中读取,我会得到以下类型的数据:

 -0.0064, -0.0047,  -0.0051, -0.0036, -0.0046, -0.0059,  -0.0051

但是,在我的C ++程序中,返回以下内容:

0.960938, -0.00390625, -0.949219, -0.00390625, -0.996094, -0.00390625

我需要以相同的方式表示数据。现在,对于8 bit .wav文件,我执行了以下操作:

uint8_t c;

for(unsigned i=0; (i < size); i++)
{
    c = (unsigned)(unsigned char)(data[i]);
    double t = (c-128)/128.0;
    rawSignal.push_back(t);
}

然而,当我为16位执行此操作时,这很有效:

uint16_t c;

for(unsigned i=0; (i < size); i++)
{
   c = (signed)(signed char)(data[i]);
   double t = (c-256)/256.0;
   rawSignal.push_back(t);
}

不起作用并显示输出(上图)。

我遵循找到的标准Here

其中datachar数组且rawSignalstd::vector<double>我可能只是将转换错误但似乎无法找出原因。有人有什么建议吗?

由于

编辑:

这是现在显示的内容(在图表中):

enter image description here

这就是它应该显示的内容:

enter image description here

5 个答案:

答案 0 :(得分:6)

这里有一些问题:

  • 8位wavs是无符号的,但是16位wavs是有符号的。因此,Carl和Jay的答案中给出的减法步骤是不必要的。我认为他们只是从你的代码中复制了,但他们错了。
  • 16位波的范围是-32,768到32,767,而不是-256到255,这使得你使用的乘法无论如何都是错误的。
  • 16位wavs是2个字节,因此你必须读取两个字节来制作一个样本,而不是一个。您似乎一次只能阅读一个角色。当您读取字节时,如果您的本机字节序不是小端,则可能必须交换它们。

假设有一个 little-endian 架构,你的代码看起来会更像这样(非常接近Carl的答案):

for (int i = 0; i < size; i += 2)
{
    int c = (data[i + 1] << 8) | data[i];
    double t = c/32768.0;
    rawSignal.push_back(t);
}

big-endian 架构:

for (int i = 0; i < size; i += 2)
{
    int c = (data[i] << 8) | data[i+1];
    double t = c/32768.0;
    rawSignal.push_back(t);
}

该代码未经测试,请LMK如果不起作用。

答案 1 :(得分:1)

(首先关于little-endian / big-endian-ness。WAV只是一种容器格式,其中编码的数据可以是无数格式。大多数编解码器都是无损的(MPEG Layer-3又称MP3,是的,流可以“打包”成WAV,各种CCITT和其他编解码器。)你假设你处理某种PCM格式,你看到RAW格式的实际波,没有进行无损转换。字节序取决于生成流的编解码器。 Is the endianness of format params guaranteed in RIFF WAV files?

这也是一个问题,如果一个PCM样本是线性比例采样整数还是有一些缩放,对数比例或其后的其他转换。我遇到的常规PCM wav文件是简单的线性比例样本,但我不是在录音或制作行业。

通往解决方案的途径:

  1. 确保您正在处理常规的16位PCM编码RIFF WAV文件。
  2. 在读取流时,始终一次读取两个字节(char)并将两个字符转换为16位短。人们在我面前展示了这一点。
  3. 您显示的波形清楚地表明您要么没有估计频率(或者您只有一个单声道而不是立体声 >)。因为采样率(44.1kHz,22KHz,11KHz,8kHz等)与分辨率(8位,16位,24位等)一样重要。也许在第一种情况下你有立体声数据。您可以单声道阅读它,您可能不会注意到它。在第二种情况下,如果你有单声道数据,那么你将在读取数据的一半时间用完样本。根据你的图表,这似乎是发生的事情。谈论另一个原因:较低的采样分辨率(以及16位也较低)通常与较低的采样率配对。因此,如果您的输入数据是录制时间,并且您认为您有22kHz的数据,但它实际上只有11kHz,那么您将从实际样本中途耗尽并读入内存垃圾。所以其中一个。
  4. 确保解释并处理循环迭代器变量和大小。看起来大小告诉您有多少字节。你只有一半的短整数样本。请注意,由于这个原因,Bjorn的解决方案正确地将i递增2。

答案 2 :(得分:0)

16位数量的范围为-32,768到32,767,而不是-256到255(仅为9位)。使用:

for (int i = 0; i < size; i += 2)
{
    c = (data[i + 1] << 8) + data[i]; // WAV files are little-endian
    double t = (c - 32768)/32768.0;
    rawSignal.push_back(t);
}

答案 3 :(得分:0)

你可能想要更像这样的东西:

uint16_t c;
for(unsigned i=0; (i < size); i++)
{
   // get a 16 bit pointer to the array
   uint16_t* p = (uint16_t*)data;
   // get the i-th element
   c = *( p + i );
   // convert to signed? I'm guessing this is what you want
   int16_t cs = (int16_t)c;
   double t = (cs-256)/256.0;
   rawSignal.push_back(t);
}

您的代码将8位值转换为有符号值,然后将其写入无符号变量。你应该看一下,看看它是不是你想要的。

答案 4 :(得分:0)

我的工作代码是

int8_t* buffer = new int8_t[size];
/*
  HERE buffer IS FILLED
*/
for (int i = 0; i < size; i += 2)
{
    int16_t c = ((unsigned char)buffer[i + 1] << 8) | (unsigned char)buffer[i];
    double t = c/32768.0;
    rawSignal.push_back(t);
}