概率代理遍历具有联合概率分布的4x4网格世界

时间:2016-09-04 03:57:03

标签: python artificial-intelligence probability agent

我正在尝试从“A Modern Approach to AI”这本简单的棋盘游戏中解决一个概率代理,但我在基本数学方面遇到了一些麻烦,主要是完整的联合分布,所以我要求一些指示

董事会是4x4平方 板上有一个怪物和两个坑 如果附近有坑/怪物,怪物和坑会在其相邻的方块中发出恶臭/微风,给代理人提供线索

在网格上写为坐标元组的房间:(x,y)1-4

例如:

访问了房间(1,1),(1,2),(2,1),我们找到了 在房间(1,2)和(2,1)

中微风

这告诉我在(1,2)和(2,1)附近的任何一个房间都可能有凹坑

P是坑的概率 这个变量在开始时均匀分布在4x4网格(16个房间)上,因此我们得到0.2的概率,即每平方有一个坑或一个怪物

B是访问过的房间是否有微风或恶臭(这意味着它旁边的坑的概率更高

完整的联合分布应为P(P11,...,P44,B11,B12,B21)

产品规则为我们提供了

P(P11,...,P44,B11,B12,B21)=

P(B11,B12,B21 | P11,...,P44)P(P11,...,P44)

Product Rule on Full Joint Distribution

到目前为止一直很好,但在这里我似乎无法迈出下一步。

第二个词我的房间均匀分布概率为0.2。 但是对于第一个学期,如果有微风的房间(B21和B12)与坑/怪物相邻,则应该为1。但是B的数字是多少?我该怎么做?

AIMA书中指出:“第一个术语是微风配置的条件概率分布,给定一个坑配置;如果微风与凹坑相邻,则其值为1,否则为“

我几天来一直在努力奋斗,没有取得进展。任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:1)

Bxy值是在细胞xy中是否观察到微风的指标。他们正式定义为:

当且仅当在(x,y)中观察到微风时,Bxy = 1,
否则Bxy = 0

所以,在你的例子中,我们已经知道了 B11 = 0,B12 = 1,B21 = 1

类似地,变量P11,P12,...,P44也是二元变量,其中Pxy = 1当且仅当单元格中存在凹坑时(x,y)。

现在看看第一个学期,我认为这是你的问题,你不明白的事情:

P (B11,B12,B21 | P11,...,P44)

这是观察(B11,B12,B21)的条件概率分布,假设在Pxy = 1的单元格(x,y)中有凹坑。

在示例情况下,您可以填写B11,B12和B21的值。你知道B11 = 0,B12 = B21 = 1(因为那是观察到的)。您不知道维修站位于哪个位置,因此您无法直接根据您的情况填写Pxy值。但是,可以为您能想到的任意情况填写这些值。

你可以说"好吧,让我们假设在位置(1,3)和#34;中只有一个坑。然后我们得到P13 = 1,所有其他Pxy = 0.对于这种特定情况,也可以计算出特定情况发生的概率(这将是0,因为你无法观察到微风(2,1)如果(1,3)中只有一个坑。

如果你可以想象所有可能的情况重复这一点,你可以结合结果来获得更有趣的答案,例如在给定观察结果的情况下在某个位置存在坑的概率。这就是文字的内容,但我相信这不再是你的问题所在。