深度学习+音乐,使用GAN生成音乐,如何播放Midi图像中的歌曲

时间:2019-03-17 19:29:13

标签: machine-learning deep-learning generative-adversarial-network

我正在探索此存储库:musegan,并试图将其提取出来。

我共享的Google Colab Link

它执行但我不知道我从哪里获得生成的音乐样本或如何运行音乐。它在.png文件夹中生成一堆./exp/图像,但我不知道对产生音乐有什么帮助

即使在该项目的自述文件Results中,如果下载该文件,它也会提供大量图像。我不知道如何使用这些图片。

我是机器学习和深度学习的新手,我之所以选择这个项目是因为我对音乐感兴趣,而且我想启发人们深度学习将如何解决这个问题。

我已经读过有关ANN,RNN和CNN和GAN的文章,但是我的水平非常低。但是我想学习这个。

我确实观看了项目所有者Video的视频,但它是中文的,我确实使用过Google Translate (Chinese to English)将音频转换为英语文本,但这并不是很好的经验。

这些是幻灯片:Slide 1 Slide 2

我知道这不是最好的第一个项目,但这是我感兴趣的,所以我将很乐意花时间来了解这个项目。

我的背景是从事前端和后端的Web开发。

1 个答案:

答案 0 :(得分:0)

您需要查找.npz文件并将其转换为midi格式,如下所示:

from pypianoroll import Multitrack

m = Multitrack('./test.npz')
m.write('./test.mid')

他们已经回答了您在存储库问题中的问题。不幸的是,它尚未在文档中。