Question

所以我想说我想混合这两个音轨：

Unmixed

在Audacity中，我可以使用“混合和渲染”选项将它们混合在一起，我会得到这个：

Audacity Mix

然而，当我尝试编写自己的代码混合时，我得到了这个：

My Mix

这基本上就是我如何混合样本：

private function mixSamples(sample1:UInt, sample2:UInt):UInt
{
    return (sample1 + sample2) & 0xFF;
}

（语法是Haxe但如果你不知道它应该很容易理解。）

这些是8位样本音频文件，我希望该产品也是8位，因此& 0xFF。

我明白通过简单地添加样本，我应该期待剪辑。我的问题是在Audacity中混合不会导致剪辑（至少不会达到我的代码所做的程度），并且通过查看第二个（更长）轨道的“尾部”，它似乎不会减小幅度。听起来也不软。

所以基本上，我的问题是：Audacity正在做什么，我不是？我想把音轨混合起来，就好像它们是在彼此之上播放一样，但我（显然）不想要这种可怕的剪辑。

修改

如果我在添加之前对值进行签名，然后根据Radiodef的建议取消对和值的设置，我会得到以下内容：

My Signed Mix

正如你所看到的那样，它比以前好多了，但与Audacity产生的结果相比，它仍然非常扭曲和嘈杂。所以我的问题仍然存在，Audacity必须采取不同的做法。

EDIT2：

我将第一首曲目与我的代码和Audacity混合在一起，然后比较发生失真的点。这是Audacity的结果：

Zoom Audacity

这是我的结果：

enter image description here

Answer 1

我认为正在发生的事情是你将它们称为无符号。典型的声波既有正面也有负面，这就是为什么它们以它们的方式加在一起（某些部分取消）。如果你有一个8位样本是-96而另一个是96，你加总它们你会得到0.如果你有无符号音频你会得到样本32和224求和= 256（偏移和溢出）

您需要做的是在求和之前签名。要对8位样本进行签名，请将它们转换为有符号的int类型，并从所有样本中减去128。我假设你拥有的是WAV文件，你需要在总和之后再次取消它们。

Audacity可能会进行浮点处理。我听说过一些关于浮点的真正可疑的说法，就像它具有“无限动态范围”和类似垃圾一样，但它并没有像整数一样以明确和明显的方式进行剪辑。浮点具有与整数相同的有限值范围，但最大值和最小值相距更远。（这是最简单的方法。）浮点可以允许更大的音频幅度变化，但捕获的是整体信噪比低于整数。

对于奇怪的失真，我最好的猜测是你使用& 0xFF做的面具。如果你想实际剪辑而不是溢出，你需要自己动手。

for (int i = 0; i < samplesLength; i++) {
    if (samples[i] > 127) {
        samples[i] = 127;
    } else if (samples[i] < -128) {
        samples[i] = -128;
    }
}

否则说你有两个样本是125，求和得到250（11111010）。然后你取消签名（加128）并获得378（101111010）。一个＆amp;会得到1111010这是122.其他数字可能会得到有效负数或接近0的结果。

如果要剪切8位以外的值，则位深度为n的满量程将为positive (2 ^ (n - 1)) - 1和negative 2 ^ (n - 1)，例如32767和-32768为16位。

你可以做的另一件事就是搜索剪辑和规范化。类似的东西：

double[] normalize(double[] samples, int length, int destBits) {

    double fsNeg = -pow(2, destBits - 1);
    double fsPos = -fsNeg - 1;

    double peak = 0;
    double norm = 1;

    for (int i = 0; i < length; i++) {
        // find highest clip if there is one

        if (samples[i] < fsNeg || samples[i] > fsPos) {
            norm = abs(samples[i]);

            if (norm > peak) {
                norm = peak;
            }
        }
    }

    if (peak != 0) {

        // ratio to reduce to where there is not a clip
        norm = -fsNeg / peak;

        for (int i = 0; i < length; i++) {
            samples[i] *= norm;
        }
    }

    return samples;
}

Answer 2

这比你想象的要简单得多;虽然您的原始文件是8位，但Audacity在内部将它们作为32位浮点处理。您可以在屏幕截图中，在每个轨道左侧的信息面板中看到这一点。这意味着在一起添加2个轨道意味着在每个点添加两个浮点样本，并且将简单地产生从-2.0到+2.0的样本值，然后将其钳制到-1到+1范围。相比之下，将两个8位整数相加将产生另一个8位数，其中值溢出并包围。（无论您使用有符号值还是无符号值，这都适用。）

Audacity如何混合音频样本？

2 个答案: