使用遗传算法训练tic tac toe的神经网络

时间:2018-05-22 12:01:25

标签: neural-network genetic-algorithm

我试图为游戏'tic tac toe'实现遗传算法。 我现在如何做到以下几点:

  1. 初始化50个随机网络
  2. 让每个网络对抗每个网络。
  3. 之后,每个网络将玩98场比赛(每侧每位球员)
  4. 以这种方式计算每个网络的适用度:fitness = wins + draws -loses
  5. 应用遗传算法:

    5.1。使用适合度值选择5个最佳网络。

    5.2。将这5个网络复制到其他45个网络上。 (所以第一次是10次,第二次是10次......)

    5.3。用随机高斯乘以系数s来改变权重的百分比。

    if(p < Random(0,1)){ weight/bias += Random.gaussian() * s; }

  6. 我现在使用的价值观是:

    p = 0.05
    s = 0.05
    

    我的网络正在通过以下方式做出决定:

      

    我正在使用深度为2的minimax算法(不是很多,我知道)。   董事会正在对网络进行评估。

    我现在的问题是它没有按预期工作。当我之后与之对战时,它通常会做出愚蠢的动作,当我放手时让我赢或不赢。

    如果有人可以帮我解决这个问题,我感到非常高兴。

    问候, 芬兰

0 个答案:

没有答案