混合两个音频缓冲区时单击/失真

时间:2016-08-30 15:33:49

标签: android buffer audiotrack distortion

我正在开发一款需要同步声音的Android音频应用。

我正在尝试组合两个声音缓冲区,并且在大振幅时会出现失真。 这就是我在做的事情:

for(int i=0;i<data2.length;i+=2)
            {

                short buf1a = data[i+1];
                short buf2a = data[i];
                buf1a = (short)((buf1a & 0xff) << 8);
                buf2a = (short) (buf2a & 0xff);
                short buf1b = data2[i+1];
                short buf2b = data2[i];
                buf1b = (short) ((buf1b & 0xff) << 8);
                buf2b = (short) (buf2b & 0xff);

                short buf1c = (short) (buf1a + buf1b);
                short buf2c = (short) (buf2a + buf2b);

                short res = (short) (buf1c + buf2c);
        int res2 = res/2;
        res = (short)res2;
                data3[i]=(byte)res;
                data3[i+1]=(byte)(res>>8);

            }

使用以下方式播放缓冲区:

   AudioTrack at = new AudioTrack(STREAM_MUSIC,44100,CHANNEL_OUT_MONO,ENCODING_PCM_16BIT,dataSize,MODE_STATIC);
            at.write(data3,0,data3.length);
            int frames = data3.length/2; //2 bytes per frame.
            Log.d(TAG,"this is data length: "+data3.length);
            Log.d(TAG,"this is assumed frame number:"+frames);
            at.setLoopPoints(0,frames,3);
            at.play();

我几乎完全遵循了此处列出的程序:Java: Mixing two WAV files without introducing noise

缓冲区数据和data2包含我要混合的wav文件中的数据。使用AudioTrack自己播放时,听起来不错。此外,除了“高幅度点击”之外,混音听起来还不错。

我认为问题是短值对于最大振幅变得太大,但我不知道为什么,因为我除以2.真的很高兴任何想法。

更新:我将混音输出到wav并在Audacity中查看。 下面的顶部波形是我与点击的混合。底部波形是当Audacity混合两个wav并且没有clicks时。当波形触及图形的“屋顶”/“底部”时,我的混音中出现咔嗒声。 我的混合似乎在这些地方有更广泛的高峰。还是没有解决这个问题。 enter image description here 更新2: 这就是问题区域的近似情况。它看起来像在Audacity版本中它切割到最高/最低值(地板/屋顶),但在我的版本中它似乎跳到另一边并在那里'完成'它的曲线。 enter image description here

2 个答案:

答案 0 :(得分:2)

我设法通过检查大数字突然改变符号来摆脱剪辑。在for循环结束时添加的下面的代码似乎可以完成这项工作并提供类似于上面问题中的大胆图表的结果。

        if(res>10000) //Avoid 'normal' cases where amplitude shifts from f.ex. 4 to -2, which we want to keep.
        {
            if((res*resPrevious)<0) //If the sign has changed suddenly for a large number, use the previous number.
            {
                Log.d(TAG,"res:"+res+"");
                res = resPrevious;
            }
        }
        if(res<-10000)
        {
            if((res*resPrevious)<0) //If the sign has changed suddenly for a large number, use the previous number.
            {
                res = resPrevious;
            }
        }
        resPrevious=res;
        data3[i] = (byte) res;
        data3[i + 1] = (byte) (res >> 8);

答案 1 :(得分:1)

你的代码激励我,最后我最终面临同样的问题。您将16字节短buf1abuf1bbuf2abuf2b值相互添加,然后将结果转换为16字节短{{1} }和buf1c。如果加法结果低于buf2c或更高,则-32,768loss conversation occours因为它超过32,767数据类型容量......

Oracle docs的摘录:

  

缩小的原始转换可能会丢失有关数值整体幅度的信息,也可能会失去精度和范围。

short

我的简单修改:)。这完美无误地完成:

short buf1c = (short) (buf1a + buf1b);
short buf2c = (short) (buf2a + buf2b);