所以我想说我想混合这两个音轨:
在Audacity中,我可以使用“混合和渲染”选项将它们混合在一起,我会得到这个:
然而,当我尝试编写自己的代码混合时,我得到了这个:
这基本上就是我如何混合样本:
private function mixSamples(sample1:UInt, sample2:UInt):UInt
{
return (sample1 + sample2) & 0xFF;
}
(语法是Haxe但如果你不知道它应该很容易理解。)
这些是8位样本音频文件,我希望该产品也是8位,因此& 0xFF
。
我明白通过简单地添加样本,我应该期待剪辑。我的问题是在Audacity中混合不会导致剪辑(至少不会达到我的代码所做的程度),并且通过查看第二个(更长)轨道的“尾部”,它似乎不会减小幅度。听起来也不软。
所以基本上,我的问题是:Audacity正在做什么,我不是?我想把音轨混合起来,就好像它们是在彼此之上播放一样,但我(显然)不想要这种可怕的剪辑。
修改
如果我在添加之前对值进行签名,然后根据Radiodef的建议取消对和值的设置,我会得到以下内容:
正如你所看到的那样,它比以前好多了,但与Audacity产生的结果相比,它仍然非常扭曲和嘈杂。所以我的问题仍然存在,Audacity必须采取不同的做法。
EDIT2:
我将第一首曲目与我的代码和Audacity混合在一起,然后比较发生失真的点。这是Audacity的结果:
这是我的结果:
答案 0 :(得分:5)
我认为正在发生的事情是你将它们称为无符号。典型的声波既有正面也有负面,这就是为什么它们以它们的方式加在一起(某些部分取消)。如果你有一个8位样本是-96而另一个是96,你加总它们你会得到0.如果你有无符号音频你会得到样本32和224求和= 256(偏移和溢出)
您需要做的是在求和之前签名。要对8位样本进行签名,请将它们转换为有符号的int类型,并从所有样本中减去128。我假设你拥有的是WAV文件,你需要在总和之后再次取消它们。
Audacity可能会进行浮点处理。我听说过一些关于浮点的真正可疑的说法,就像它具有“无限动态范围”和类似垃圾一样,但它并没有像整数一样以明确和明显的方式进行剪辑。浮点具有与整数相同的有限值范围,但最大值和最小值相距更远。 (这是最简单的方法。)浮点可以允许更大的音频幅度变化,但捕获的是整体信噪比低于整数。
对于奇怪的失真,我最好的猜测是你使用& 0xFF
做的面具。如果你想实际剪辑而不是溢出,你需要自己动手。
for (int i = 0; i < samplesLength; i++) {
if (samples[i] > 127) {
samples[i] = 127;
} else if (samples[i] < -128) {
samples[i] = -128;
}
}
否则说你有两个样本是125,求和得到250(11111010)。然后你取消签名(加128)并获得378(101111010)。一个&amp;会得到1111010这是122.其他数字可能会得到有效负数或接近0的结果。
如果要剪切8位以外的值,则位深度为n的满量程将为positive (2 ^ (n - 1)) - 1
和negative 2 ^ (n - 1)
,例如32767和-32768为16位。
你可以做的另一件事就是搜索剪辑和规范化。类似的东西:
double[] normalize(double[] samples, int length, int destBits) {
double fsNeg = -pow(2, destBits - 1);
double fsPos = -fsNeg - 1;
double peak = 0;
double norm = 1;
for (int i = 0; i < length; i++) {
// find highest clip if there is one
if (samples[i] < fsNeg || samples[i] > fsPos) {
norm = abs(samples[i]);
if (norm > peak) {
norm = peak;
}
}
}
if (peak != 0) {
// ratio to reduce to where there is not a clip
norm = -fsNeg / peak;
for (int i = 0; i < length; i++) {
samples[i] *= norm;
}
}
return samples;
}
答案 1 :(得分:1)
这比你想象的要简单得多;虽然您的原始文件是8位,但Audacity在内部将它们作为32位浮点处理。您可以在屏幕截图中,在每个轨道左侧的信息面板中看到这一点。这意味着在一起添加2个轨道意味着在每个点添加两个浮点样本,并且将简单地产生从-2.0到+2.0的样本值,然后将其钳制到-1到+1范围。相比之下,将两个8位整数相加将产生另一个8位数,其中值溢出并包围。 (无论您使用有符号值还是无符号值,这都适用。)