什么是常见声音频率 - >人类感知信息密度图?

时间:2012-11-27 16:20:17

标签: audio mp3 signal-processing fft

人类不同地感知不同的声音频率。例如,可以听到的频率是20Hz到20kHz;见Hearing range

equal-loudness contours所示,不同的频率也被感知到不同的敏感度;另见Loudness。这在测量人类感知的响度时是相关的,例如,见ReplayGain

但是,我猜这个图表对于人类感知的信息密度不一定是相同的(如果你可以这样称呼它)。例如。可能存在被认为是响亮的频率但感知信息密度不那么高的频率。我不确定是不是这样。是吗?或者它基本相同?也许我对它的理解也太天真了。

从我天真的理解MP3的工作原理(以及其他有损音频编码)是它为更重要的频率存储更多信息,而对于那些不太重要的频率则更少。 “更重要”意味着人类感知的信息密度更高。

(Meta:也许StackOverflow不是最好的SE网站。问什么会更好?)

1 个答案:

答案 0 :(得分:2)

心理声学上认为“信息密度”很难界定。然而,刚好可微的音调轮廓(例如Mel scale)接近。它不是基于关于音调/频率的感知响度,而是基于人类听觉系统感知主观上不同的音调/注意频谱上音调的最小变化的能力。如果“信息”是听觉事件的音高/基频,则Mel音阶描述每个频率的“信息密度”。

在这种情况下,你是对的,因为Mel音阶与响度无关,虽然与某些频谱相关。有些频率被认为是响亮的,但正如你所说,这种感知的“信息密度”并不高。

然而,感知响度本身就是信息,对于那些影响成功将信息传递到人类听觉系统的心理因素,您可能需要研究Critical Bands,特别是Auditory Masking。 / p>