音乐作为LSTM模型的输入

时间:2019-01-22 13:17:06

标签: keras deep-learning lstm recurrent-neural-network

是否有可能使用LSTM生成更复杂的音乐,而不仅仅是钢琴音符(所有教程都是关于钢琴音乐的,我找不到更复杂的东西)?

我正在考虑使用不同的乐器来训练模型,但是我不知道如何将普通的音乐文件(.mp3或.wav)转换为网络输入,或者如何从音乐文件中提取乐器。我的模型是改编自this post

你有什么主意吗?

model = Sequential()
model.add(LSTM(128,input_shape=(network_input.shape[1], 
network_input.shape[2]), return_sequences=True))
model.add(Dropout(0.3))
model.add(LSTM(64, return_sequences=True))
model.add(Dropout(0.3))
model.add(LSTM(32))
model.add(Dense(32))
model.add(Dropout(0.3))
model.add(Dense(n_vocab))
model.add(Activation('softmax'))
model.compile(loss='categorical_crossentropy', optimizer='rmsprop')

0 个答案:

没有答案