我得到一个只有10x2像素的游戏作为输入,它在训练一小时后自学完成。现在我想使用模型的一个浮点值输出而不是三个分类器输出。三个分类器输出停止,一步右,一步左。现在我想生成一个输出值,告诉我,例如-4 => 4步 - 左,+ 2 => 2步 - 右等等。
但是经过1-2小时的训练后,它只产生0.001左右的数字,但它应该产生-10.0-> +10.0之间的数字?
我是否需要以完全相反的方式使用它,或者我可以使用分类器模型输出实际值而不需要更改多少代码?
感谢您的帮助
答案 0 :(得分:0)
训练分类器要比提出一个好的损失函数简单得多,它会为你提供有意义的scalaer值。很多(!)更简单。
使它成为一个有21个等级的分类器(0 = 10左,1 = 9左,2 = 8左,......,10 =停留,11 = 1对,...,20 = 10对)