我正在尝试使用Ray&RLlib解决多代理环境。我想使用自定义丢失的RLlib A3C测试环境。
我想研究一下图形的一些参数,以便调试我的自定义策略图形。但是,我找不到终端和日志的打印功能输出。如何在工作进程中打印参数?
具体来说,我想在训练期间打印出sample_batch和other_agent_batches。
ray.rllib.agetnts.a3c.a3c_tf_policy_graph
@override(PolicyGraph)
def postprocess_trajectory(self,
sample_batch,
other_agent_batches=None,
episode=None):
print(sample_batch) # Parameters I want to look at
print(other_agent_batches) # Parameters I want to look at
completed = sample_batch["dones"][-1]
if completed:
last_r = 0.0
...
return compute_advantages(sample_batch, last_r,self.config["gamma"], self.config["lambda"])