scipy的wavfile.read函数的输出

时间:2019-02-23 12:42:55

标签: python-3.x scipy wav audio-processing

我尝试使用scipy.io.wavfile.read函数获取音轨的声压,并按照doc中的两个输出指示获取:采样率和数据numpy数组。到目前为止一切顺利。

我的问题是输出数组是(Nx2)维,我不知道这两个维代表什么。我期望得到一个(Nx1)维数组,其中包含样本总数。

我已经看过网上了,没找到任何东西,即使将音频信号转换为单声道后,我仍然得到一个Nx2阵列,所以我不认为这些是左右声道(但是我可能错了)

运行以下代码:

scipy.io.wavfile.read(path+"slow_jazz.wav")

提供以下输出:

(44100, array([[-1.37977577e-06,  8.62224842e-05],
   [ 1.10934685e-04, -1.24923863e-05],
   [ 3.23722816e-05,  6.47113484e-05],
   ...,
   [ 2.37652988e-04,  1.36341288e-04],
   [ 2.67631025e-04,  2.15149150e-04],
   [ 2.91718607e-04,  2.33943792e-04]], dtype=float32))

知道发生了什么吗?

1 个答案:

答案 0 :(得分:0)

最后一个维度是通道数。 2表示您有一个立体声wav文件作为输入。