我从这样的音频文件中分解了频谱图:
import librosa
y, sr = librosa.load('my audio file.wav')
S = np.abs(librosa.stft(y))
W, H = librosa.decompose.decompose(S, n_components=32)
现在如何将分解后的频谱图重新构成为实际的频谱图。
我想要的就是这种功能:
S=recompose(W,H)
答案 0 :(得分:0)
返回的结果是线性分解为激活和分量。我们可以使用这两个点积的另一种方法。
import librosa
import numpy
import sklearn.decomposition
filename = librosa.util.example_audio_file()
y, sr = librosa.load(filename)
y = y[:20000] # smaller file, make it go faster
# abs() is not invertible, can replace with minmax scaling
S = numpy.abs(librosa.stft(y))
transformer = sklearn.decomposition.NMF(n_components=32)
W, H = librosa.decompose.decompose(S, transformer=transformer)
S_recomposed = W.dot(H)
print(numpy.sum(numpy.abs(S - S_recomposed)))
请注意,重组永远不会是完美的。但是随着n_components
的增加,它应该会变得更好。