应用错误收集

在RaspberryPi上构建语音转文本神经网络

时间：2020-01-29 09:48:12

标签： neural-network

我想构建一个神经网络，或者通常是对一个能够安装在嵌入式设备（例如RaspberryPi）上的系统进行编码，该系统可以将我说的任何内容转换为文本。有什么可以做的吗？我在互联网上进行搜索，发现一些可以在线运行或可以使用的程序。我不需要，我想构建一个开放源代码来完成从语音到文本的翻译。我也在stackoverflow上进行了搜索，并且找到了以下链接：How to create text-to-speech with neural network，但我想要相反的内容（语音到文本）。我不是在寻找可以识别的现成的模式词。我正在考虑原始语音，它可以识别原始语音并将其转换为文本。有什么想法应该从哪里开始？

1 个答案:

答案 0 :(得分：1)

基本上，您正在寻找的是一个神经网络，该神经网络将数据流作为输入（音频文件）并产生数据流作为输出（例如ascii文本）。

为此，我建议您对一些主题获得深刻的见解和直觉：

逻辑回归
深度神经网络
卷积神经网络
递归神经网络
强化学习-我认为这不是必需的，但这可能会帮助您更快地训练模型

在这些主题上获得足够的知识当然需要数小时的学习和实践，但是互联网上充斥着关于所有主题的精彩课程。

祝你好运！