通过“标准化”,我的意思是“增加/减少总体积,以使最大值达到最大净空。”
我是学校新闻工作人员的一部分,老师发送广告,但他们往往太大声或太软。我想创建一个规范音频的程序(无压缩或限制)。它通常必须与.mov和.wmv文件一起使用。谁能引导我走向一些好的教程,图书馆等?
答案 0 :(得分:1)
将音频流从AV容器中解复用并解压缩:您需要ffmpeg库的包装器。例如,尝试pyffmpeg,AVbin,pymedia。
规范化:使用Numpy每个样本整数数组,找到max然后乘以数组以放大/衰减音量。考虑使用ReplayGain。
将音频重新压缩并将原始视频流重新复用到新容器中:与上述库相同,但更有可能造成困难,尤其是对于专有容器和编解码器。 (例如,我相信ffmpeg只能生成一个非常古老的WMA版本。)
与使用现成的应用程序相比,它不会直截了当,我不确定它是否值得。例如,ffmpeg本身有一个可以批处理脚本的命令行,例如avidemux有命令行和GUI接口。
此外,我怀疑你会发现简单的峰值归一化不会让你在使有效音量水平相似方面走得更远;通常你也需要使用一定数量的动态范围压缩。