应用错误收集

我想做一个只能看4个字的AI机器人：“上”，“下”，“左”，“右”。

当我的朋友制作一个python脚本，该脚本通过声音执行一些任务，例如打开youtube时，只需说“ Youtube”，然后Chrome浏览器就会使用youtube.com URL打开。但是系统很慢，因为他们正在使用Google Assistant / ai处理语音，这让我感到不耐烦。

然后我有了一个主意，那就是如果一个脱机的AI系统只有几句话，我们就能得到一些期望的结果，而且将会非常快。

例如：-我有一个遥控车，想说声控，就像我说“上”车应该向前移动一样，对于“下”->向后，“左”->左和“右” “->正确＆” {任何其他声音}“->闪烁指示灯，表明系统听不清

所以，请有人帮助我。

我应该如何开始？
我应该如何训练AI Bot？
我需要什么？
还有我应该知道的其他事情。

谢谢。