我想要做的是设置一个子程序,分析每200毫秒的声音文件,并将特定频率范围的频率强度值(从0到1作为浮点数)吐出到数组中我后来保存了。然后,该值继续用作图形的不透明度值,该图形应该“选通”到音频文件。
问题是,我以前从未尝试过音频分析,也不知道从哪里开始。我看起来pymedia和scipy / numpy认为我能够使用FFT来实现这一点,但我不确定如何操纵这些数据以达到预期的结果。 Spectra的SpectrAnalyzer类文档几乎不存在,网站上的示例实际上并不适用于最新版本的库 - 这并不能让我的生活更轻松。
我将如何开始这个项目?我完全不知道我应该使用哪些库。