我在强化学习任务中使用回声状态网络(ESN)作为Q函数。在特定油藏拓扑结构的测试阶段,我设法实现了高精度,平均90%(光谱半径= 0.9,正则化系数= 10,#输入单位= 2,#输出单位= 1,#储存单位= 8,没有泄漏率。)
在100集的训练之后,该系统在测试阶段实现了高准确度。但是当我用不同的随机种子初始化网络权重时,它的行为变得非常不稳定,并且无法像以前那样实现高性能。我想知道如何克服这个随机性问题,并且ESN对于其输入和储层权重的不同随机初始化是稳健的,并且可以很好地推广?
这里我是如何初始化我的网络的。从正态分布中采样的输入权重和储层权重(均值= 0且std = 1)。输入权重矩阵用统一方差归一化,储层权重通过除以最大绝对特征值并乘以谱半径进行归一化。
提前致谢
Ramin
答案 0 :(得分:0)
我倾向于同意你的意见:你的水库需要更多的神经元才能增加捕获正确动态的概率。 但是,关于你的第二个问题,我说这个原理与传统的前馈NN没有太大的不同,你需要经验参数搜索。更具体地说,对于ESN,我做了以下事情: