我正在尝试用
读取ffmpeg生成的wav文件ffmpeg -i av
FFmpeg生成一个标题大小为18但没有任何扩展数据的wav文件。
这是我的数据结构:
struct wav_header {
uint32_t chunk_id;
uint32_t chunk_data_size;
uint32_t riff_type;
uint32_t fmt;
uint32_t fmt_chunk_size;
uint16_t format_tag;
uint16_t channels;
uint32_t samples_per_second;
uint32_t bytes_per_second;
uint16_t block_align; /* 1 => 8-bit mono, 2 => 8-bit stereo or 16-bit mono, 4 => 16-bit stereo */
uint16_t bits_per_sample;
};
struct fact_header {
uint32_t chunk_id;
uint32_t chunk_data_size;
uint32_t sample_length;
};
struct data_header {
uint32_t id;
uint32_t size;
};
如果我读出来,我会得到以下wav文件的结果:
chunk_data_size: 40836134
ftm_chunk_size: 18
channels: 2
samples_per_second (samplerate): 48000
bytes_per_second: 192000
block_align: 4
bits_per_sample: 16
data_id: 61746164 -> 'data' OK
data_size: 40836096
我现在尝试使用公式
计算长度data_size / bytes_per_second
并获得以下输出:
length_in_seconds: 212.68800354
length_in_minutes: 3.54480004 (length_in_seconds / 60)
但是当我在iTunes中打开我的文件时,我的长度为3:31。我也尝试过其他声音文件,我总是有点太过分了。
我还尝试过,将hexwmp我的wav文件。 hexdump显示的输出比我做的少 for(i< data_size; i + = 2)printf(“%02x”,data [i])
所以我在某种程度上读得太远了?
我在整个互联网上搜索了公式,但我有点卡住,因为我总是得出相同的结果。
http://www-mmsp.ece.mcgill.ca/documents/audioformats/wave/wave.html
您可以阅读以下声明:
“WAVE文件通常具有在声音数据之前或之后的信息块(数据块)。一些程序(天真地)假设对于PCM数据,文件头正好是44个字节长,文件的其余部分包含声音数据。这不是一个安全的假设。“
这可能是我做错了。但是我怎么能得到正确的sound_chuck_data_size呢?
修改
lile gcb 下面指出一切都没问题。解决方案是时间存储在十进制时间,我不得不将其转换为常规时间:-)这是我提出的,它工作正常:
track.duration_dec = (float)data.size / (header.bytes_per_second * 60);
track.duration_time = convert_time(track.duration_dec);
static double convert_time(double input) {
double integral;
double frac;
char buffer[48];
frac = modf(input, &integral);
sprintf(buffer, "%d.%1.f", (int)integral, frac*60);
return atof(buffer);
}
答案 0 :(得分:3)
听起来不错。所以你的歌是3.54480004。如前所述,这是十进制的。所以你有3分钟然后0.54480004 * 60这是33.28秒。所以我说3.33分钟