是否有使用卷积神经网络制作音频的方法?
通过回网制作图像有很多方法。但我没有看到关于制作音频的文章或帖子。
根据stackoverflow上的这个主题,帖子作者说:
“我发现音频可以表示为频谱图。”
那么为什么不能这样做呢?
要使用Convnets执行此操作,我应该:
a)将LSTM与conv图层一起使用?
B)输出应该是什么?考虑到眼镜...
答案 0 :(得分:1)
是的,当然有,Deepmind的WaveNet产生的音频非常类似于“类似人”的音质。它还可以生成音乐。
https://deepmind.com/blog/wavenet-generative-model-raw-audio/