在policy_graph

时间:2019-04-11 11:30:35

标签: ray

我正在尝试使用Ray&RLlib解决多代理环境。我想使用自定义丢失的RLlib A3C测试环境。

我想研究一下图形的一些参数,以便调试我的自定义策略图形。但是,我找不到终端和日志的打印功能输出。如何在工作进程中打印参数?

具体来说,我想在训练期间打印出sample_batch和other_agent_batches。

ray.rllib.agetnts.a3c.a3c_tf_policy_graph

@override(PolicyGraph)
def postprocess_trajectory(self,
                           sample_batch,
                           other_agent_batches=None,
                           episode=None):

    print(sample_batch)        # Parameters I want to look at
    print(other_agent_batches) # Parameters I want to look at

    completed = sample_batch["dones"][-1]
    if completed:
        last_r = 0.0
        ...



    return compute_advantages(sample_batch, last_r,self.config["gamma"], self.config["lambda"])

0 个答案:

没有答案