Audacity如何混合音频样本?

时间:2013-11-21 00:56:22

标签: audio sampling mixing audacity

所以我想说我想混合这两个音轨:

Unmixed

在Audacity中,我可以使用“混合和渲染”选项将它们混合在一起,我会得到这个:

Audacity Mix

然而,当我尝试编写自己的代码混合时,我得到了这个:

My Mix

这基本上就是我如何混合样本:

private function mixSamples(sample1:UInt, sample2:UInt):UInt
{
    return (sample1 + sample2) & 0xFF;
}

(语法是Haxe但如果你不知道它应该很容易理解。)

这些是8位样本音频文件,我希望该产品也是8位,因此& 0xFF

我明白通过简单地添加样本,我应该期待剪辑。我的问题是在Audacity中混合不会导致剪辑(至少不会达到我的代码所做的程度),并且通过查看第二个(更长)轨道的“尾部”,它似乎不会减小幅度。听起来也不软。

所以基本上,我的问题是:Audacity正在做什么,我不是?我想把音轨混合起来,就好像它们是在彼此之上播放一样,但我(显然)不想要这种可怕的剪辑。

修改

如果我在添加之前对值进行签名,然后根据Radiodef的建议取消对和值的设置,我会得到以下内容:

My Signed Mix

正如你所看到的那样,它比以前好多了,但与Audacity产生的结果相比,它仍然非常扭曲和嘈杂。所以我的问题仍然存在,Audacity必须采取不同的做法。

EDIT2:

我将第一首曲目与我的代码和Audacity混合在一起,然后比较发生失真的点。这是Audacity的结果:

Zoom Audacity

这是我的结果:

enter image description here

2 个答案:

答案 0 :(得分:5)

我认为正在发生的事情是你将它们称为无符号。典型的声波既有正面也有负面,这就是为什么它们以它们的方式加在一起(某些部分取消)。如果你有一个8位样本是-96而另一个是96,你加总它们你会得到0.如果你有无符号音频你会得到样本32和224求和= 256(偏移和溢出)

您需要做的是在求和之前签名。要对8位样本进行签名,请将它们转换为有符号的int类型,并从所有样本中减去128。我假设你拥有的是WAV文件,你需要在总和之后再次取消它们。

Audacity可能会进行浮点处理。我听说过一些关于浮点的真正可疑的说法,就像它具有“无限动态范围”和类似垃圾一样,但它并没有像整数一样以明确和明显的方式进行剪辑。浮点具有与整数相同的有限值范围,但最大值和最小值相距更远。 (这是最简单的方法。)浮点可以允许更大的音频幅度变化,但捕获的是整体信噪比低于整数。

对于奇怪的失真,我最好的猜测是你使用& 0xFF做的面具。如果你想实际剪辑而不是溢出,你需要自己动手。

for (int i = 0; i < samplesLength; i++) {
    if (samples[i] > 127) {
        samples[i] = 127;
    } else if (samples[i] < -128) {
        samples[i] = -128;
    }
}

否则说你有两个样本是125,求和得到250(11111010)。然后你取消签名(加128)并获得378(101111010)。一个&amp;会得到1111010这是122.其他数字可能会得到有效负数或接近0的结果。

如果要剪切8位以外的值,则位深度为n的满量程将为positive (2 ^ (n - 1)) - 1negative 2 ^ (n - 1),例如32767和-32768为16位。

你可以做的另一件事就是搜索剪辑和规范化。类似的东西:

double[] normalize(double[] samples, int length, int destBits) {

    double fsNeg = -pow(2, destBits - 1);
    double fsPos = -fsNeg - 1;

    double peak = 0;
    double norm = 1;

    for (int i = 0; i < length; i++) {
        // find highest clip if there is one

        if (samples[i] < fsNeg || samples[i] > fsPos) {
            norm = abs(samples[i]);

            if (norm > peak) {
                norm = peak;
            }
        }
    }

    if (peak != 0) {

        // ratio to reduce to where there is not a clip
        norm = -fsNeg / peak;

        for (int i = 0; i < length; i++) {
            samples[i] *= norm;
        }
    }

    return samples;
}

答案 1 :(得分:1)

这比你想象的要简单得多;虽然您的原始文件是8位,但Audacity在内部将它们作为32位浮点处理。您可以在屏幕截图中,在每个轨道左侧的信息面板中看到这一点。这意味着在一起添加2个轨道意味着在每个点添加两个浮点样本,并且将简单地产生从-2.0到+2.0的样本值,然后将其钳制到-1到+1范围。相比之下,将两个8位整数相加将产生另一个8位数,其中值溢出并包围。 (无论您使用有符号值还是无符号值,这都适用。)