我最近一直在思考这个问题。我已经建立了这个小应用程序,在其中我可视化一个wav文件并给它一个波形(类似于大胆的内容)。
我注意到,由于某种原因,存在负面和正面的价值观。好吧,我能理解正弦波中负值的重要性,其中方向代表电流的方向。但负面价值在音乐中代表什么?
答案 0 :(得分:13)
Sound基本上是一个压力波,由“峰值”组成,这些峰值是压力较高的区域,“低谷”是低压区域。麦克风通过利用一些物理材料特性来测量该压力随时间的变化来响应入射压力波。录制是对这些测量进行采样并将其转录到某些媒体的过程。
选择合理的表示方式是将环境压力调为零,压力越高越高。另一个合理的表示是将环境压力作为半尺度,较低的压力和较高的压力高于一半。其他表示也是可能的,甚至不要求入射压力和测量值之间的关系是线性的。
是否使用签名或无符号表示只是历史和惯例的问题。例如,16位音频通常表示为有符号,但通常不是8位音频。
历史上,电话系统使用了称为a-law或µ-law的非线性函数的8位无符号测量。非线性表示在相同比特率内支持比线性表示更大的动态范围。
答案 1 :(得分:4)
如果没有声音,波形是平坦的(Y = 0)。
Y轴涉及相对于环境压力的压力差。正Y值表示压缩,负Y值表示稀疏。
答案 2 :(得分:4)
声音是弹性介质中压力变化形式的机械能。这些压力变化作为来自振动源的波传播。 气压的变化(空气是传播介质)可以用WAVEFORM表示,WAVEFORM是声音的图形表示。实际上,声波在长距离波浪(而不是横向波浪)中通过空气传播。
压缩和稀疏的概念进入图中,其中压缩是比环境压力更高的压力时段(或当输出为0时),并且稀疏是压力低于环境压力的时段。因此,当纵波入射在麦克风/换能器的膜上时。压缩产生幅度的正值,稀疏产生幅度的负值。
答案 3 :(得分:2)
完全一样......波形文件只代表一个采样声波。并且声波(如同任何类型的大多数波浪)有时低于并且有时高于平衡(在声波的情况下,局部气压低于或高于环境气压)因此样本有时是负的并且有时正。
最后它只是一个解决均衡的问题。 16位声音文件的样本值范围为-32.768到+32.767。您可以将32.768添加到所有样本值并获取0到65.535范围内的样本值,并将均衡(总静音(没有DC偏移))从0移动到32.768。
答案 4 :(得分:1)
声音文件中的样本值可以被认为是用于记录声音的麦克风膜的移动:麦克风膜振动(正)和低于(负)其静止位置(零)。
类似地,为了再现这种声音,扬声器膜将从其静止位置(零)向前(正)和向后(负)移动。围绕中心位置的这种振动将产生声音。
答案 5 :(得分:-2)