读取wav文件,持续时间/ data_size的计算总是错误的

时间:2012-08-15 09:22:12

标签: c linux wav duration wave

我正在尝试用

读取ffmpeg生成的wav文件

ffmpeg -i av

FFmpeg生成一个标题大小为18但没有任何扩展数据的wav文件。

这是我的数据结构:

struct wav_header {
  uint32_t chunk_id;
  uint32_t chunk_data_size;
  uint32_t riff_type;
  uint32_t fmt;
  uint32_t fmt_chunk_size;
  uint16_t format_tag;
  uint16_t channels;
  uint32_t samples_per_second;
  uint32_t bytes_per_second;
  uint16_t block_align;         /* 1 => 8-bit mono, 2 => 8-bit stereo or 16-bit mono, 4 => 16-bit stereo */
  uint16_t bits_per_sample;
};

struct fact_header {
  uint32_t chunk_id;
  uint32_t chunk_data_size;
  uint32_t sample_length;
};

struct data_header {
  uint32_t id;
  uint32_t size;
};

如果我读出来,我会得到以下wav文件的结果:

chunk_data_size: 40836134

ftm_chunk_size: 18
channels: 2
samples_per_second (samplerate): 48000
bytes_per_second: 192000
block_align: 4
bits_per_sample: 16

data_id: 61746164    -> 'data' OK
data_size: 40836096    

我现在尝试使用公式

计算长度
data_size / bytes_per_second 

并获得以下输出:

length_in_seconds: 212.68800354
length_in_minutes: 3.54480004    (length_in_seconds / 60)

但是当我在iTunes中打开我的文件时,我的长度为3:31。我也尝试过其他声音文件,我总是有点太过分了。

我还尝试过,将hexwmp我的wav文件。 hexdump显示的输出比我做的少 for(i< data_size; i + = 2)printf(“%02x”,data [i])

所以我在某种程度上读得太远了?

我在整个互联网上搜索了公式,但我有点卡住,因为我总是得出相同的结果。

http://www-mmsp.ece.mcgill.ca/documents/audioformats/wave/wave.html

您可以阅读以下声明:

“WAVE文件通常具有在声音数据之前或之后的信息块(数据块)。一些程序(天真地)假设对于PCM数据,文件头正好是44个字节长,文件的其余部分包含声音数据。这不是一个安全的假设。“

这可能是我做错了。但是我怎么能得到正确的sound_chuck_data_size呢?

修改

lile gcb 下面指出一切都没问题。解决方案是时间存储在十进制时间,我不得不将其转换为常规时间:-)这是我提出的,它工作正常:

track.duration_dec = (float)data.size / (header.bytes_per_second * 60);
track.duration_time = convert_time(track.duration_dec);


static double convert_time(double input) {
  double integral;
  double frac;
  char buffer[48];
  frac = modf(input, &integral);
  sprintf(buffer, "%d.%1.f", (int)integral, frac*60);
  return atof(buffer);
}

1 个答案:

答案 0 :(得分:3)

听起来不错。所以你的歌是3.54480004。如前所述,这是十进制的。所以你有3分钟然后0.54480004 * 60这是33.28秒。所以我说3.33分钟