应用错误收集

使用卷积神经网络生成音频

时间：2017-01-23 23:59:42

标签： audio deep-learning theano keras

是否有使用卷积神经网络制作音频的方法？

通过回网制作图像有很多方法。但我没有看到关于制作音频的文章或帖子。

根据stackoverflow上的这个主题，帖子作者说：

“我发现音频可以表示为频谱图。”

那么为什么不能这样做呢？

要使用Convnets执行此操作，我应该：

a）将LSTM与conv图层一起使用？

B）输出应该是什么？考虑到眼镜...

1 个答案:

答案 0 :(得分：1)

是的，当然有，Deepmind的WaveNet产生的音频非常类似于“类似人”的音质。它还可以生成音乐。

https://deepmind.com/blog/wavenet-generative-model-raw-audio/