以下问题是我从人工智能课程中发现的一项考试练习。
"建议一种启发式机制,使用Hill-Climbing算法解决此问题。 (S =起点,F =终点/目标)。不允许对角线移动。"
很明显,曼哈顿距离或欧几里德距离将在(3,4)发送机器人并且不允许回溯,这个问题的可能解决方案(启发式机制)是什么?
编辑:为了使问题更加清晰,我在电路板上标记了曼哈顿的一些距离:
很明显,使用曼哈顿距离,机器人的下一步移动将在(3,4),因为它具有2的启发值 - 慧聪将选择它并永远陷入困境。目标是通过寻找合适的启发式算法来尝试并且永远不会走这条路。
答案 0 :(得分:4)
我认为障碍物很热,而且热量上升。我将单元格的净成本计算为曼哈顿度量距离与F的总和加上热量罚分。因此,有一种吸引力将机器人拉向F,以及一种驱使它远离障碍物的排斥力。
有两种类型的热惩罚:
1)触摸障碍物是非常糟糕的。查看给定单元格正下方行中相邻单元格的2或3个单元格。对于直接位于给定单元下方的每个阻塞单元添加15,对于直接位于
下方的每个对角邻居添加102)对于不直接接触说明书的细胞 - 热量更加分散。我将其计算为其列和相邻列中单元格下方平均阻塞块数的6倍。
以下显示了组合这一切的结果,以及从S到F的路径:
关键是平均值导致机器人在撞到顶行时向左转而不是向右转。朝向左侧的未加热柱使冷却器方向变冷。有趣的是要注意所有单元格(可能除了右上角的两个单元格)是如何通过这种启发式绘制到F中的。