在RaspberryPi上构建语音转文本神经网络

时间:2020-01-29 09:48:12

标签: neural-network

我想构建一个神经网络,或者通常是对一个能够安装在嵌入式设备(例如RaspberryPi)上的系统进行编码,该系统可以将我说的任何内容转换为文本。有什么可以做的吗?我在互联网上进行搜索,发现一些可以在线运行或可以使用的程序。我不需要,我想构建一个开放源代码来完成从语音到文本的翻译。我也在stackoverflow上进行了搜索,并且找到了以下链接:How to create text-to-speech with neural network,但我想要相反的内容(语音到文本)。我不是在寻找可以识别的现成的模式词。我正在考虑原始语音,它可以识别原始语音并将其转换为文本。有什么想法应该从哪里开始?

1 个答案:

答案 0 :(得分:1)

基本上,您正在寻找的是一个神经网络,该神经网络将数据流作为输入(音频文件)并产生数据流作为输出(例如ascii文本)。

为此,我建议您对一些主题获得深刻的见解和直觉:

  • 逻辑回归
  • 深度神经网络
  • 卷积神经网络
  • 递归神经网络
  • 强化学习-我认为这不是必需的,但这可能会帮助您更快地训练模型

在这些主题上获得足够的知识当然需要数小时的学习和实践,但是互联网上充斥着关于所有主题的精彩课程。

祝你好运!