用于解决倒立摆的适应度函数是什么?
我正在用遗传算法进化神经网络。我不知道如何评估每个人。
我尝试最小化摆锤的角度,并在评估时间结束时(10秒)最大化行进距离,但这不起作用。
神经网络的输入是:推车速度,推车位置,摆角速度和时间(t)的摆角。输出是在时间(t + 1)
施加的力提前感谢。
答案 0 :(得分:0)
我发现this paper列出了他们的目标函数:
定义为:
其中" Xmax = 1.0,thetaMax = pi / 6,_X' max = 1.0,theta' Max = 3.0,N是迭代步数,T = 0.02 * TS和Wk是选择的正权重。" (根据纸张的角度,速度和位置使用特定值,但是,您需要根据摆锤的边界条件使用自己的值。)
该论文还指出"第一和第二项确定累计和 标准化的X1和X3从零开始的绝对偏差,以及最小化时的第三项,最大化了生存时间。"
这应该足以让你开始,但我强烈建议你阅读全文。这是一个伟大的阅读,我发现它很有教育意义。
你可以制作自己的健身功能,但我认为使用摆锤的位置,速度,角度和角度变化率的想法是健身功能的好主意。但是,您可以选择以与本文作者选择模拟其功能的方式不同的方式使用这些变量。
读取谐波振荡器也不会有什么坏处。它们采用一般形式:
米 X" + B x' -k x = A cos(w * t)
(其中B或A可能为0,具体取决于振荡器是否分别为阻尼/无阻尼或驱动/未驱动)。