我正在使用强化学习来开发AI。
这是一个玩家应该避免砖块从天而降的游戏。
有20块砖倒在地上。 game screen shot,game play video link
我使用具有线性函数的强化学习来实现AI。
很难选择最佳功能来获得满意的结果。
无论如何,自从我试图成功以来,它最终获得了最高分。
但这很奇怪。
有一些原因。
与此同时,我试图使用很多功能。我将功能定义为游戏屏幕尺寸(960 * 640)。
我填补了玩家的砖块相对坐标的功能。我希望能比以前更好的结果。我训练了这种方法7个小时,但没有成功。
底线是我应该如何选择功能以使其发挥最佳效果?还是有任何不同的方法来解决它?