据说MP3帧包含1152个样本。什么是“样本”呢?右侧和左侧通道的一对值?或者是左右通道的单个值?
答案 0 :(得分:6)
使用的语言可能会有点混乱。它的正确性在于每个音频通道的每个帧将具有1152(或384或576,取决于MPEG版本和层)。由于压缩,实际存储数据的方式比每个通道的单个值更复杂。
如果您想了解更多信息,我建议您http://blog.bjrn.se/2008/10/lets-build-mp3-decoder.html建立一个精美,详细的博客,以便建立读者对MP3格式的理解,以便构建解码器。
您还可以查看http://wiki.hydrogenaudio.org/index.php?title=MP3#Polyphase_Filterbank_Formula的相关技术信息。链接固定在一个专门说明的部分:“音频由每个音频通道的1152个样本帧处理”但整个页面描述了MP3格式的各个方面。
答案 1 :(得分:0)
MP3 接收 2304 个 16 位 PCM 样本,每个通道 1152 个,并基本上对其执行重叠 MDCT,这样每个通道可以获得 576 个频域分量。因为是半重叠,下一次MDCT变换每通道将包含756个新样本和756个旧样本,每通道输出756个样本,所以你得到了从时域到频域的1:1样本映射。
心理声学模型是执行有损压缩的,我不知道细节。这个输出得到霍夫曼编码(这是无损压缩)。
每个 MP3 帧包含 2 个 576 个样本的颗粒(对应于 576 个新的和 576 个旧的 PCM 样本)。这意味着每个通道 576 个样本,或总共 1152 个样本。因此,每个帧对应于每个通道 1152 个新的 PCM 样本,因此 2304 samples。每个颗粒包含两个通道的霍夫曼位,两个通道的比例因子。帧中的边信息由霍夫曼解码器使用。
样本通常是指一个时间点,因此这将包括左右声道,但您可以将它们分开。