在状态B之前达到状态A的鼠标的概率是多少

时间:2018-01-22 00:50:06

标签: artificial-intelligence maze robotics markov-chains

Maze

我有如上所示的迷宫(使用链接),状态3包含奖品,而状态7包含休克。鼠标可以随机放置在1到9的任何状态,并随机均匀地移动迷宫

Pi表示在状态7之前鼠标达到状态3的概率,假设AIM在隔室i中开始。

如何计算ε{1,2,3,4,5,6,7,8,9}的Pi。

2 个答案:

答案 0 :(得分:0)

直观地说,只要起点是随机的,任何一个方格的着陆概率都是均匀的。

+---+---+---+
| 1 | 2 | 3 |
+---+---+---+
| 4 | 5 | 6 |
+---+---+---+
| 7 | 8 | 9 |
+---+---+---+

如果鼠标从位置3或7开始,则游戏结束。

如果鼠标从位置1开始,则有1/3的机会在第2,5或4位结束,依此类推。

如果我们从包含1/9概率的每个单元开始,我们可以通过将当前值乘以鼠标从另一个位置移入的概率来计算下一代的频率分布。例如,在第二代。细胞1将具有来自细胞2的1/5小鼠和来自细胞4的1/5小鼠和来自细胞5的1/8小鼠。因此,下一代细胞1是(1/9)(1 / 5)+(1/9)(1/5)+(1/9)(1/8),或21/360,或0.0583。然后我们可以计算所有剩余单元的概率。

以下是格式化表格中的前五代

    1       2       3       4       5
1   0.111   0.058   0.059   0.046   0.039
2   0.111   0.095   0.078   0.065   0.054
3   0.111   0.169   0.228   0.274   0.312
4   0.111   0.095   0.078   0.065   0.054
5   0.111   0.163   0.115   0.101   0.082
6   0.111   0.095   0.078   0.065   0.054
7   0.111   0.169   0.228   0.274   0.312
8   0.111   0.095   0.078   0.065   0.054
9   0.111   0.058   0.059   0.046   0.039

答案 1 :(得分:0)

Px 成为游戏在 3 位置结束的概率,如果它位于 x 位置。

我们知道 P3 = 1 P7 = 0

如果您从任何其他单元格开始,那么在您移动之后,您基本上会在新单元格中重新开始游戏。因此,可以根据他们可以移动到的邻居的概率来计算其他7个小区的概率:

P5 = P2 / 4 + P4 / 4 + P6 / 4 + P8 / 4

P2 = P1 / 3 + P5 / 3 + P3 / 3

P1 = P2 / 2 + P4 / 2

...等

对于每个细胞,您有一个线性方程 - 9个细胞的9个方程。使用高斯消元法或类似技术来求解9个概率的方程组。