我正在使用C自己的神经网络库为2048游戏制作ai,我也用C编写了2048。我想我对一般培训过程缺乏了解,我想直接问一下。我想训练我的神经网络,以使其了解游戏的模式,从而使贪婪的游戏最佳移动。培训过程如何运作?
我尝试了这些: 设3个数据(3个输入目标对)以训练模型。
训练神经网络(反复进行前馈和后向传播)以适合第一个数据,并在误差低于阈值时停止,然后从第二个数据继续并继续进行下去
与第一个相同,但在达到迭代计数而不是错误阈值时会停止
对每个数据进行一次前向和反向传播,并重复进行直到达到迭代计数为止(第一个数据为前向后退,第二个数据为前向后退并继续)
与2相同,但重复该过程,直到神经网络在测试数据中获得最高分
我尝试了这些,但是它没有学习模式。反向传播和前馈正常运行。我正在使用辍学正则化来减少过度拟合,我也尝试了L1正则化。我也在改组训练数据,所以问题不关在此。哪种训练方法是正确的?