我的任务似乎是微不足道的 了解"嘈杂"给定的录音是。
这个录音来自于录音机,a 奥林巴斯VN-733 PC相当便宜(我不是在做 广告,我只是提到这个,因为我绝不 旨在做任何事情"专业"在这里,我只需要 解决一个看似简单的问题)。
为此,我已经获得了几个数据集 来自不同的外部地点,特别是公园或 近路录音。也就是说,存在的噪音 这些特定的位置,然后比较这个噪音, 平均而言,与其他地点一样。
换句话说:
我必须知道嘈杂的位置A与位置的比较 B和C.
我每次录制1分钟,以便录制 至少可以比较记录的时间跨度 到其他地方(我正在使用它 在所有位置都有相同的语音记录 身高等......)。
可以在以下位置找到示例文件:
http://shevegen.square7.ch/test.mp3
(这可能最终会被移动,它只是作为 例如,这些录音现在听起来如何。我是 理想情况下,对最初嘈杂的剪辑声不满意 我只捕捉汽车的背景噪音等。 但是现在这已经足够了。)
现在我的具体问题是,我怎样才能知道"嘈杂" 或者"响亮"这是?
主要目标是将它们与其他.mp3进行比较 文件,这足以满足我的目的。
但理想情况下,平均计算会很好 怎么"响亮"每个人.mp3然后进行比较 它到其他的(有几个录音 每个给定的地理位置,所以我甚至可以合并它们 在一起)。
有一些类似的问题,但没有特别的问题 我能找到的可以回答这个问题 客观的方式,或许我不明白 手头的问题。我已经拥有了所有的音频数据集 但我不知道如何找出"响亮的"任何人 他们是个人的;智能手机上有一些应用程序 声称他们可以自动执行此操作但从那以后 我没有任何智能手机,这对我来说是个死胡同。
非常感谢任何一般性建议。
答案 0 :(得分:1)
噪音是一个难以定义的概念。然后,我将专注于响度。
您可以计算每个文件的能量。为此,您需要访问音频信号的样本(通常来自您编程语言的内置函数)。然后你可以计算信号的RMS能量。
这可能是更基本的处理。