因此,我们的想法是计算机代理将分为两层,即有意识和无意识。
无意识部分本质上是一组输入和输出设备,我通常将其视为传感器(键盘,温度等等,以达到你想象的极限)和输出方法(特别是在屏幕和扬声器的情况下)家用电脑,但再次到你想象的极限)。传感器可以随时添加或删除,并且该层为有意识的层提供两个主要通道,单个输入和单个输出。定义在这两层之间传递什么样的信息有点困难,但基本思想是有意识的部分不断地从无意识部分的输出接收信号(各种抽象层次),并且有意识的部分可以发送任何信息。它希望通过输入通道进入无意识层。
有意识的层最初知之甚少,只是被无意识层的输入完全摧毁,它知道如何发回信号,尽管它对任何特定信号如何影响无意识部分一无所知。有意识的部分具有大量的存储空间和处理能力,但是,它都是易失性存储器。
现在提出问题。我希望系统的有意识部分“增长”,因为它不知道它能做什么,它只知道它可以发送信号,所以它开始通过向管道发送信号并看到它如何影响它收到的传感器数据。死路一条是计算机最初并没有试图达到目标。它只是发送信号。要把它想象成一个婴儿出生,他们需要食物,或者睡觉或者被移出太阳等等。婴儿的感官输入被喂养到它的大脑,然后大脑决定尝试利用它的输出。为了得到它需要的东西。
电脑有什么样的自然需求?
What have I tried?
特别想想婴儿如何变得饥饿,我当然没有读过任何有关猫饥饿儿童或任何事情的猫扫描的研究,但我想也许一个特定的信号来自无意识的不断增长的速度,只有信号才会满足送回来导致宝宝吃饭。有意识的大脑的工作是最小化每种类型的信号进入的速率。换句话说,计算机的“本能”是限制每个信号进入的速率。还有什么其他“本能”?这个类比的问题当然是,计算机不需要吃东西。或者至少我无法将饮食转化为计算机所需的东西。
Outside of the scope of this question
这样做的最终目标是教一台除了如何与世界互动以发挥井字游戏之外什么都不知道的计算机。所以我的另一个想法是提供一个按钮,你可以按下它来手动刺激特定信号进入意识状态的速率,当它做坏事或手动缓解特定信号的状态时它的速率。
答案 0 :(得分:3)
机器智能程序通常从Mazlow's Hierarchy of Needs的奖励级别开始,因为它们没有办法感知生理,安全和安全或社会需求。然而...
在生理水平上,计算机以电力为食。插入UPS,告诉计算机何时使用电池运行,并且您有可能有用的输入来感知生理需求。
让它能够“感知”它“失去时间”或者在时间记录上有间隙(由于电源故障),你可能会引入对安全和安全的需求。
通过使其需要互动来介绍社交需求。当键盘输入之间经过很多时间时,它会“感到”孤独。
检测丢失的时间,自上次键盘交互以来所经过的时间以及使用电池运行可能是无意识层可用的输入之一,可以定期碰到有意识层。
Two Faces of Tomorrow中的计算机科学家解决了类似的问题,在卫星沙箱上训练计算机以便了解。例如,它们通过让它意识到它将在没有电力的情况下停止运行然后提供适当的刺激并观察响应来满足这些需求。
The Adolescence of P-1是沿着这些方向开展的另一项有趣的工作。
答案 1 :(得分:3)
一个机器人被编程为相信它喜欢鲱鱼三明治。这实际上是整个实验中最困难的部分。一旦机器人被编程为相信它喜欢鲱鱼三明治,就会在它前面放一个鲱鱼三明治。于是机器人想到了自己,“啊!鲱鱼三明治!我喜欢鲱鱼三明治。”
然后将它蜷缩在鲱鱼三明治勺中舀起鲱鱼三明治,然后再拉直。不幸的是,对于机器人来说,它的设计方式使得拉直的动作使鲱鱼三明治从鲱鱼三明治勺中直接滑回并落到机器人前面的地板上。于是机器人想到了自己,“啊!一个鲱鱼三明治......等等,一遍又一遍地重复同样的动作。唯一阻止鲱鱼三明治厌倦整个该死的生意和爬行的东西寻找其他方式来消磨时间是因为鲱鱼三明治,只是在几片面包之间的一点点死鱼,对于发生的事情比机器人稍微不那么警觉。
研究所的科学家因此发现了生活中所有变化,发展和创新背后的驱动力,这就是:鲱鱼三明治。他们发表了一篇论文,这篇论文被广泛批评为极其愚蠢。他们检查了他们的数字并意识到他们实际发现的是“无聊”,或者更确切地说,是无聊的实际功能。在兴奋的狂热中,他们继续发现其他情绪,如“烦躁”,“抑郁”,“不情愿”,“ickiness”等等。当他们停止使用鲱鱼三明治时,下一个重大突破就来了,于是突然有一大堆新的情绪突然出现给他们学习,比如“放松”,“快乐”,“焦虑”,“胃口”,“满足”,以及最重要的是,对“幸福”的渴望。
这是所有人中最大的突破。
〜来自道格拉斯亚当斯的<银河漫游指南
<强>加成强>
看一下强化学习。