我试图为游戏'tic tac toe'实现遗传算法。 我现在如何做到以下几点:
fitness = wins + draws -loses
应用遗传算法:
5.1。使用适合度值选择5个最佳网络。
5.2。将这5个网络复制到其他45个网络上。 (所以第一次是10次,第二次是10次......)
5.3。用随机高斯乘以系数s来改变权重的百分比。
if(p < Random(0,1)){
weight/bias += Random.gaussian() * s;
}
我现在使用的价值观是:
p = 0.05
s = 0.05
我的网络正在通过以下方式做出决定:
我正在使用深度为2的minimax算法(不是很多,我知道)。 董事会正在对网络进行评估。
我现在的问题是它没有按预期工作。当我之后与之对战时,它通常会做出愚蠢的动作,当我放手时让我赢或不赢。
如果有人可以帮我解决这个问题,我感到非常高兴。
问候, 芬兰