MlpLnLstmPolicyin稳定基准线的默认架构是什么?

时间:2019-08-05 09:59:17

标签: python-3.x reinforcement-learning openai-gym

稳定基准允许您定义custom network architetcure;这会改变共享层,价值层,策略层及其各自大小的数量。

稳定基准也具有默认策略。 MlpLnLstmPolicy网络的默认网络体系结构是什么?此外,最好了解层之间的激活以及所使用的任何退出(如果适用)。我似乎在文档中找不到这些信息。

1 个答案:

答案 0 :(得分:1)

MlpLnLstmPolicy的定义为here。此类从here定义的LstmPolicy继承方法。

tanh中使用的默认激活。您可以浏览LstmPolicy定义中提供的其他默认参数以获取更多信息。