我正在观看一段视频,该视频讲述了一些有关强化学习的知识,并且我了解到,如果机器人做出错误的动作,那么他们将以负面的学习速度训练网络。通过这种方法,我想到了什么。
我的问题是“我可以使用输出错误的数据来训练神经网络吗?”
为了说明这种方法,我将使用我现在正在研究的眼动仪项目。 在我的项目中,有一些照片和与我查看该照片的位置相对应的点。它像网格(9,16)。如果我看屏幕中间,则表示输出为(4,7.5)。如果我在屏幕的左上方看,则表示(0,0)。通常,对于我在中间看的照片,我们使用该照片作为输入,并使用(4,7.5)作为输出,以正学习率训练网络。现在让我改一下这个问题。我可以使用负学习率来训练一个模型,该模型给出的照片是以输入为中间,以(0,0)作为输出(标签)为中间的吗?
谢谢,如果我对stackoverflow的规则犯了一个错误,对不起。我将等待您的宝贵答案。