在“人工智能:现代方法”一书中,Norvig和Russell定义了一个理性的代理人如下:
Rational代理:对于每个可能的感知序列,理性代理应该选择一个最大化其性能度量,鉴于感知序列提供的证据以及代理人具有的任何潜在知识。
性能指标是我们希望代理执行的理想操作(由设计人员修复和提供)。
我的问题是:给定代理,绩效衡量,代理周围的环境以及代理能够做的行动,我如何证明代理是理性的?
我知道这很一般。我有一本书中的例子,但是,这是一项任务,我需要的只是方向。
谢谢,
答案 0 :(得分:1)
列出代理人能够以最高性能和最低性能(最符合或最类似于所需行动,或为目标行动奠定基础......)或至少不制作行动的行动不可能或不太可能在未来实现这一行动)
您可以通过表明尽可能采取理想的行动来证明代理人是理性的。
编辑:鉴于无限可能的决定,您可以检查(a)最后决定周围的区域,或(b)可能决策的n维空间中的随机点;如果存在“更高”点的“路径”,即更合理的行动,并且您的代理人没有接受,则您的代理人不会理性行事。如果没有这样的路径,或者有一条路径并且代理人“跟随”它,那么,你的代理人可能不是无所不知和理性的,但根据决定,它可以“看到”它是理性行事。
答案 1 :(得分:1)
在我的论文中,我们使用了环境中(伪)随机对手的基线;如果我们的代理人通过反复试验超过50%的时间超过对手我们已经证明我们的代理人不是随机行动,并且表现优于随机。 (使用常用的统计工具进行检查,确保结果可靠等)
但我不知道这是否回答了理性的问题。我没有真正考虑到这一点。但是当它反复随机行动时,代理人必须刻意采取行动以改善其在环境中的状况。
更强大的反对者本身就是理性的AI,然后提供了实际的性能基准。但理性的代理人是否意味着最优的代理人? (可能没有;除了一些棋盘游戏之外几乎没有任何最佳代理商)
但是当你正在制作代理时,优于随机总是你想成为的地方:)如果没有,它就不能被称为AI;)
这至少是一个建议。如果正确分析和解释数据,实验就是一件很有用的事情。