我使用PySC2软件包通过Python训练星际争霸机器人:https://github.com/deepmind/pysc2
给出这样的自定义代理:
class SmartAgent(base_agent.BaseAgent):
def __init__(self):
super(SmartAgent, self).__init__()
(可在此处找到https://github.com/deepmind/pysc2/blob/master/pysc2/agents/base_agent.py的BaseAgent)
在这个特工中,我想存储/显示结果和每个情节之后的消息类似的情节:
第16集游戏步骤之后,第6集完成了。结果:[-1],奖励: [-1],得分:[5270]
def step(self, obs):
super(SmartAgent, self).step(obs)
# If it is the last step output result:
if obs.last():
print(self.episodes) # works
print(self.outcome) # does not work
我可以用self.episodes
来获得情节,但是由于self.outcome
不存在,我如何得到结果?
任何提示表示赞赏。