我想做一个只能看4个字的AI机器人:“上”,“下”,“左”,“右”。
当我的朋友制作一个python脚本,该脚本通过声音执行一些任务,例如打开youtube时,只需说“ Youtube”,然后Chrome浏览器就会使用youtube.com URL打开。但是系统很慢,因为他们正在使用Google Assistant / ai处理语音,这让我感到不耐烦。
然后我有了一个主意,那就是如果一个脱机的AI系统只有几句话,我们就能得到一些期望的结果,而且将会非常快。
例如:-我有一个遥控车,想说声控,就像我说“上”车应该向前移动一样,对于“下”->向后,“左”->左和“右” “->正确&” {任何其他声音}“->闪烁指示灯,表明系统听不清
所以,请有人帮助我。
我应该如何开始?
我应该如何训练AI Bot?
我需要什么?
还有我应该知道的其他事情。
谢谢。
答案 0 :(得分:0)
您应该如何开始:阅读;-)否则,我建议您学习深度神经网络课程。您的问题非常笼统。
一种临时方法-应该可以解决您的问题-可以从样本中提取音频频谱,该样本足够长以包含您的单词,但不会更长。有了这些信息,您就可以训练卷积神经网络-我将首先尝试一维卷积。