我正在研究RNN / LSTM。我已经用RNN完成了一个简单的项目,在其中我将文本输入到RNN中。但是我不知道如何将语音输入到RNN中以及如何对递归网络进行语音预处理。我已经从中型网站和其他网站上阅读了许多文章。但是我无法在网络中使用语音。您可以共享任何涉及语音和RNN / LSTM的项目,也可以共享任何对我有帮助的项目。
答案 0 :(得分:0)
您将需要将原始音频信号转换成声谱图或使用RNN / LSTMS易于处理的其他方便格式。 This个中等博客应该会有所帮助。您可以查看this github repo进行实施。