是否有可能使用LSTM生成更复杂的音乐,而不仅仅是钢琴音符(所有教程都是关于钢琴音乐的,我找不到更复杂的东西)?
我正在考虑使用不同的乐器来训练模型,但是我不知道如何将普通的音乐文件(.mp3或.wav)转换为网络输入,或者如何从音乐文件中提取乐器。我的模型是改编自this post
你有什么主意吗?
model = Sequential()
model.add(LSTM(128,input_shape=(network_input.shape[1],
network_input.shape[2]), return_sequences=True))
model.add(Dropout(0.3))
model.add(LSTM(64, return_sequences=True))
model.add(Dropout(0.3))
model.add(LSTM(32))
model.add(Dense(32))
model.add(Dropout(0.3))
model.add(Dense(n_vocab))
model.add(Activation('softmax'))
model.compile(loss='categorical_crossentropy', optimizer='rmsprop')