我想设计一个神经网络,在训练之后将.mp3文件作为输入,然后根据训练,它将决定音乐在1-10的等级上是好还是坏。但为此,我需要将音频文件转换为波长,频率,幅度和定义音乐所需的所有其他参数的数组,然后使用这些数组作为神经网络的输入。我该如何处理这个问题?
答案 0 :(得分:3)
如果您将.mp3文件转换为.wav,则可以执行以下操作:
from scipy.io import wavfile as wav
from scipy.fftpack import fft
import numpy as np
rate, data = wav.read('music.wav')
fft_out = fft(data)
来自http://www.dummies.com/programming/python/performing-a-fast-fourier-transform-fft-on-a-sound-file/