计算机器学习算法的盈利/亏损

时间:2018-04-02 17:23:45

标签: javascript algorithm machine-learning

以下项目是一个javascript项目。

在我们的游戏中有一个赛道,算法可以选择向左或向右转,或直接向前行驶。 如果我们给算法赋予正确的权重,它将正确地移动100%。现在我的问题是:我们如何通过错误计算完全做到这一点?最后,算法应该接近最优。 我们目前的做法:

重量:

let leftWeight = [1.0, -1.0, -1.0];
let stayWeight = [-1.0, 1.0, -1.0];
let rightWeight = [-1.0, -1.0, 1.0];

存储在权重[]中。 计算即将到来的举动:

leftMove = (leftSensor * weights[0][0]) + (staySensor * weights[1][0]) + (rightSensor* weights[2][0]);
stayMove = (leftSensor * weights[0][1]) + (staySensor * weights[1][1]) + (rightSensor* weights[2][1]);
rightMove = (leftSensor * weights[0][2]) + (staySensor * weights[1][2]) + (rightSensor* weights[2][2]);

传感器存储信息' road'或者!' road'。 使用之前的值,它可以100%正确工作,但我们希望它自己达到这种状态。因此,我们有一个“赢/输”移动处理程序'会考虑这是好事还是坏事 但在这一点上,我们不知道如何继续。 改变这里的事情导致了方向+'移动'值变为NaN或...... TLDR;
如果算法执行错误,我们不知道如何评估损失/如何更改值。 欢迎任何建议

如果缺少任何信息以了解问题,请告诉我。

谢谢;)

编辑: 路(阵列)
|! - [R | |! - [R | |! - [R | | R | |! - [R |
|! - [R | |! - [R | |! - [R | | R | |! - [R |
|! - [R | |! - [R | | R | | R | |! - [R |
|! - [R | |! - [R | | R | |! - [R | |! - [R |

0 个答案:

没有答案