从AMR-NB文件中提取音频帧

时间:2013-07-05 13:22:42

标签: java audio amr 3gp

我编写了一个算法来从AMR文件中提取每个帧。我认为文件的前6个字节是标题,以下信息是音频帧。每个音频帧由帧头和音频数据组成。帧头以字节为单位表示帧的大小(使用CMR模式​​表 - http://www.developer.nokia.com/Community/Wiki/AMR_format)。帧大小存储在帧的第一个字节中 - >第二位到第5位,将MSB计为第一位。

该算法不起作用,我决定以二进制方式(0和1)在屏幕上显示每个字节,看来有时帧大小数大于7且CMR表只有0 ... 7值。

以下是CMR表:

CMR      MODE        FRAME SIZE( in bytes )
0 AMR    4.75        13
1 AMR    5.15        14
2 AMR    5.9         16
3 AMR    6.7         18
4 AMR    7.4         20
5 AMR    7.95        21
6 AMR    10.2        27
7 AMR    12.2        32

和我的输出(来自amr文件的每个字节)是:

0 -> 0 0 0 0 0 0 0 0 
1 -> 0 0 0 0 0 0 0 0 
2 -> 0 0 0 0 0 0 0 0 
3 -> 0 0 0 1 1 0 0 0 
4 -> 0 1 1 0 0 1 1 0 
5 -> 0 0 1 0 1 1 1 0 
6 -> 1 0 0 1 1 1 1 0 
7 -> 0 0 0 0 1 1 1 0 
8 -> 1 1 0 0 1 1 0 0 
9 -> 1 1 1 0 0 1 1 0 
10 -> 0 0 0 0 1 1 1 0 
11 -> 0 0 1 0 1 1 0 0 
12 -> 0 0 0 0 0 0 0 0 
13 -> 0 0 0 0 0 0 0 0 
14 -> 0 0 0 0 0 0 0 0 
15 -> 0 0 0 0 0 0 0 0 
16 -> 1 0 0 1 0 1 1 0 
17 -> 1 1 0 0 1 1 1 0 
18 -> 1 1 1 1 0 1 1 0 
19 -> 1 0 1 1 0 1 1 0 
20 -> 1 1 0 0 1 1 0 0 
21 -> 1 1 1 0 0 1 1 0 
22 -> 0 0 0 0 1 1 1 0 
23 -> 0 0 1 0 1 1 0 0 
24 -> 0 0 0 0 0 0 0 0 
25 -> 0 0 0 0 0 0 0 0 
26 -> 0 1 0 0 0 0 0 0 
27 -> 1 0 0 1 1 0 0 0 
28 -> 1 0 1 1 0 1 1 0 
29 -> 1 1 1 1 0 1 1 0 
30 -> 1 1 1 1 0 1 1 0 
31 -> 0 1 1 0 1 1 1 0 
32 -> 0 0 0 0 0 0 0 0 
33 -> 0 0 0 0 0 0 0 0 
34 -> 0 0 0 0 0 0 0 0 
35 -> 0 0 1 1 0 1 1 0 
36 -> 1 0 1 1 0 1 1 0 
37 -> 0 1 1 0 1 1 1 0 
38 -> 0 0 0 1 0 1 1 0 
39 -> 0 0 1 0 0 1 1 0 
40 -> 0 0 0 0 0 0 0 0 

我拿了字节nr 6:10011110 - > 0011是nr 3,3的相应CMR值是18.我跳过18个字节,达到字节nr。 6 + 18 = 24:00000000 - 0的CMR值为13,我跳过另外13个字节 - > 24 + 13 = 37:01101110 - > 1101 is 13 WHICH ISN'T IN CMR table

我做错了什么?我想以二进制方式打印是正确的。下面是读取每个帧的算法(不是用于显示二进制方式):

private void displayNrOfFrames() throws Exception{
        FileInputStream fis = null;

        try {
            fis = new FileInputStream(mFile);
            long result = fis.skip(6);
            if(result != 6){
                throw new Exception("Could not skip first 6 bytes(header) of AMR.");
            }

            int number = 0;
            int bit = 0;
            byte b;
            BitSet bs;
            while((b = Integer.valueOf(fis.read()).byteValue()) != -1){     
                bs = Util.fromByte(b);          
                number = 0;
                //convert bits [1..4] to number
                for (int i = 1; i <= 4; i++) {
                    bit = bs.get(i)? 1:0;
                    number += bit*Math.pow(2, 4 - i);                   
                }
                System.out.println(number);
                if(!CMR_MAP.containsKey(number)){
                    throw new Exception("Could not parse AMR file.");
                }
                //skip the number of bytes of this frame.
                fis.skip(CMR_MAP.get(number));

            }       

        } catch (IOException e) {
            e.printStackTrace();
        }
    }

[EDIT]

我似乎错误地将字节转换为BitSet,然后导致算法失败。在字节nr.6,它应该表示为数字121,但是错误地表示为nr 158.此外,二进制输出是错误的,因为它使用相同的转换。我没有检查转换方法(我没有在这里发布)。抱歉打扰了。

1 个答案:

答案 0 :(得分:1)

我希望我的答复还不算太晚。

首先要做的事情: 来自同一个reference 你可以看到前6个字节(文件头)应该是0x23,0x21,0x41,0x4D,0x52,0x0A。这是一个恒定值,应该始终存在。如果它不存在则该文件可能已损坏且不应使用。所以你不应该盲目地跳过前6个字节。

现在,AMR编解码器支持DTX(不连续传输)。 DTX只不过是一种通过在声码器检测到静音时产生更少数据来节省带宽的方法。您的amr解析器应该准备好期待DTX。对于AMR-NB(amr窄带或简称amr),使用模式8发信号通知DTX。因此,您的CMR地图应包含以下条目

  

8 AMR SID 6(SID是静音指示灯......表示静音期正在开始)

在SID之后,会有实际的静音帧长度为1个字节(只是标题...没有数据),所以你应该有

的条目
  

15 AMR NO_DATA 1

模式9-11应该被丢弃。并且模式12-14保留供将来使用(通常这些也被丢弃)。考虑到正在使用单通道AMR,已经给出了上述所有信息。

在您粘贴的照片中

  

6 - &gt; 1 0 0 1 1 1 1 0

这应该是AMR Toc标题

    0 1 2 3 4 5 6 7
   +-+-+-+-+-+-+-+-+
   |F|  FT   |Q|P|P|
   +-+-+-+-+-+-+-+-+

对于存储,F位应为0,但在您的示例中为1.并且最后两位(填充位)必须为零,但在您的示例中,这些不是0.我相信您的示例并不是完整的故事在这里。