使用卷积神经网络生成音频

时间:2017-01-23 23:59:42

标签: audio deep-learning theano keras

是否有使用卷积神经网络制作音频的方法?

通过回网制作图像有很多方法。但我没有看到关于制作音频的文章或帖子。

根据stackoverflow上的这个主题,帖子作者说:

  

“我发现音频可以表示为频谱图。”

那么为什么不能这样做呢?

要使用Convnets执行此操作,我应该:

a)将LSTM与conv图层一起使用?

B)输出应该是什么?考虑到眼镜...

1 个答案:

答案 0 :(得分:1)

是的,当然有,Deepmind的WaveNet产生的音频非常类似于“类似人”的音质。它还可以生成音乐。

https://deepmind.com/blog/wavenet-generative-model-raw-audio/