我正在探索此存储库:musegan,并试图将其提取出来。
它执行但我不知道我从哪里获得生成的音乐样本或如何运行音乐。它在.png
文件夹中生成一堆./exp/
图像,但我不知道对产生音乐有什么帮助
即使在该项目的自述文件Results中,如果下载该文件,它也会提供大量图像。我不知道如何使用这些图片。
我是机器学习和深度学习的新手,我之所以选择这个项目是因为我对音乐感兴趣,而且我想启发人们深度学习将如何解决这个问题。
我已经读过有关ANN,RNN和CNN和GAN的文章,但是我的水平非常低。但是我想学习这个。
我确实观看了项目所有者Video的视频,但它是中文的,我确实使用过Google Translate (Chinese to English)将音频转换为英语文本,但这并不是很好的经验。
我知道这不是最好的第一个项目,但这是我感兴趣的,所以我将很乐意花时间来了解这个项目。
我的背景是从事前端和后端的Web开发。
答案 0 :(得分:0)
您需要查找.npz
文件并将其转换为midi格式,如下所示:
from pypianoroll import Multitrack
m = Multitrack('./test.npz')
m.write('./test.mid')
他们已经回答了您在存储库问题中的问题。不幸的是,它尚未在文档中。