我正在尝试将openAI体育馆用作学习环境,以期深入了解强化学习。为此,我读了《使用Python进行动手强化学习》一书。本书提供了一些代码。通常,代码不起作用,因为我必须先将其解包,如openai gym env.P, AttributeError 'TimeLimit' object has no attribute 'P'
所示但是,我个人仍然对这种展开的原因感兴趣。为什么需要拆开包装?这到底是做什么的?为什么书中没有这样编码?是Giuliov认为的过时软件吗?
谢谢。
答案 0 :(得分:0)
Open AI Gym提供许多不同的环境。它们每个都有自己的一组参数和方法。但是,它们通常由称为Env
的单个类(如真实OOPL上的接口)包装。此类公开了任何环境中最常见的最基本方法,例如step
,reset
和seed
。拥有这个“接口”类很棒,因为它使您的代码与环境无关。如果要在不同的环境中测试单个代理,这也使事情变得更容易。
但是,如果要访问特定环境的幕后动态,则可以使用unwrapped
属性。