标签: grid 2d probability-density
我希望根据Falk和Konald在this论文中定义的交替概率,生成分布有奖励的2D网格环境(1是奖励,0不是奖励)。
基本思想是,一旦随机方格被播种(左上角,例如)为1或0,则相邻方块保持与前一个相同或切换的概率由交替概率给出。
本文将生成过程描述为left to right和top to bottom。我不清楚作者打算如何实现它。
left to right
top to bottom
算法: