如何将语音文件输入RNN / LSTM进行语音识别?

时间:2019-02-01 00:50:18

标签: machine-learning deep-learning lstm recurrent-neural-network

我正在研究RNN / LSTM。我已经用RNN完成了一个简单的项目,在其中我将文本输入到RNN中。但是我不知道如何将语音输入到RNN中以及如何对递归网络进行语音预处理。我已经从中型网站和其他网站上阅读了许多文章。但是我无法在网络中使用语音。您可以共享任何涉及语音和RNN / LSTM的项目,也可以共享任何对我有帮助的项目。

1 个答案:

答案 0 :(得分:0)

您将需要将原始音频信号转换成声谱图或使用RNN / LSTMS易于处理的其他方便格式。 This个中等博客应该会有所帮助。您可以查看this github repo进行实施。