我正在尝试使用强化学习算法来玩一个简单的迷你高尔夫游戏。
我认为我可以通过使用贪婪方法或函数逼近来实现。我想知道这是否可行,并想找到一个类似的例子。
答案 0 :(得分:2)
在文献中,强化学习是最接近于人工智能的东西,因此,可以将其应用于这款迷你高尔夫游戏。
以下将是布局:
状态:球在球场上的位置(x,y,z)
动作:角度,力量
奖励:球距洞的距离
取决于您的领域有多大,这个问题应该可以轻松解决。
我想我可以通过使用贪婪方法或函数逼近来实现。
您肯定希望至少使用电子贪婪方法来促进早期情节中的探索。
为简化问题,我会首先考虑仅使用二维或什至是一维的情况,以便您熟悉算法。
对于一维情况,您的状态将是球沿线的位置。您的动作是施加到球上的力量。奖励可以基于您的球距球门柱有多远。
如果您愿意,我可以为您编写此环境的代码。