因此,我要实现的目标的确切说明在问题标题中。我一直在使用ARSS,它是一个C ++程序,可以将音频文件转换为对数频率标度的声谱图,并且可以从生成的声谱图中恢复声音。我正在尝试在python中做类似的事情。从python调用ARSS可执行文件是不可能的-数据最初表示为numpy数组,因此我必须先导出wav文件,然后进行转换,然后读取图像。此外,图像显然每像素存储1个字节(ARSS输出灰度图像),而我需要浮点精度。
我一直在玩scipy.signal.spectrogram,但是,似乎没有任何方法可以使频率标度非线性(nperseg取决于所采样的频率)。还是在那里?
所以,我的三个问题是:
是否可以使用scipy.signal.spectrogram或使用任何其他scipy方法使频率标度对数?
是否可以使用scipy从频谱图中恢复原始信号?
也许有更好的库可以执行这样的任务?