我的模特学习能力有问题,我觉得我错过了一些明显的东西。如视频中所示,蛇学会找到第一个奖励,但在那之后改进停止。我错过了什么?我尝试改变参数并添加辍学但似乎影响很小。
我遇到的另一个小问题是tesseract读取分数的速度。我添加了几个配置设置,但效果很小。目前的阅读时间约为0.5秒,这对于快节奏的比赛来说非常糟糕。
我的模型和参数:
#Parameters
keys = [W,A,S,D]
action_size = len(keys)
memory = deque(maxlen=2000)
gamma = 0.95
epsilon = 1.0
epsilon_min = 0.01
epsilon_decay = 0.995
learning_rate = 0.001
#Model
model = Sequential()
model.add(Dense(80, input_dim=80, activation='relu'))
model.add(Dense(80, activation='relu'))
model.add(Dropout(0.2))
model.add(Dense(action_size, activation='linear'))
model.compile(loss='mse',
optimizer=Adam(lr=learning_rate))
我的问题是如何提高"准确度"该模型。 欢迎提出所有建议。
以下是视频演示: Snake Video
Github链接到完整代码 - https://github.com/ttorkar/snake