订单发布神经网络?

时间:2010-08-15 22:35:02

标签: language-agnostic machine-learning neural-network

我有兴趣编写某些使用机器学习的软件,并根据外部数据执行某些操作。

但是我遇到了问题(这对我来说总是很有趣) - 如何编写发出订单订单序列的机器学习软件?

问题在于,据我所知,神经网络在输入上获得了很多,并且根据以前的训练结果“回忆”了输出。立即(好吧,或多或少)。所以我不确定“发布命令”如何适合该系统,特别是当系统执行的操作对系统产生一定的延迟影响时。我也有点不确定如何训练这件事。

此类系统的示例:
1.第一人称射击敌人控制器。据我了解,有可能为机器人实现神经网络控制器,它将根据一些输入(可能是健康,弹药等)切换机器人行为策略(好吧,为它们分配优先级)。但我没有看到制作高阶控制器的方法,可以发出一系列命令,如“去那里,然后左转”。此外,机器人的行为将影响控制机器人行为的变量。即射击减少弹药,从高处坠落降低健康等。
2.自动化市场交易者。当然有可能制造出能够预测下一个市场价格的系统。但是,我不知道如何制造出能够购买东西,观察趋势,然后将其卖回以获取利润/掩盖损失的系统。 3.汽车司机。同样,(据我所知),可以根据位置/速度/扭矩数据和先前训练的结果制作维持所需运动矢量的系统。但是我没有看到让这种系统(学会)执行一系列动作的方法。

即。据我所知,神经网络在技术上是一个矩阵 - 你给它输入,它产生输出。但是如何生成可能改变环境计划的行动序列呢?

如果此类任务不完全适合神经网络,还可以使用其他什么?

P.S。我明白这个问题并不完全清楚,我怀疑我缺少一些知识。所以我会欣赏一些指示(即要阅读的书籍/资源等)。

2 个答案:

答案 0 :(得分:2)

可以尝试将输出神经元直接连接到控制器,例如向自我射击者前进,转身或射击,或为交易者购买订单。但是,我认为当你让神经网络解决一个相当具体的子问题,然后让“正常”程序解释它的答案时,获得了最好的结果。例如,你可以让神经网构建一个“我想去哪里”的地图覆盖图,然后机器人将其转化为动作。交易者的神经网络可以产生“我想要多少纸张”,然后机器人会将其转换为买入或卖出订单。

子问题应由神经网络解决的决定是其设计的核心问题。重要的是,可以向神经网络传授好的解决方案。

编辑:在示例中对此进行了扩展:当自我射手机器人被射击时,它不应该想要在那里;当它开枪射击别人时,它应该想要更多。当交易者从纸张上亏钱时,它本来应该想要的更少;如果它获得了,它应该想要更多。可以教这些东西。

答案 1 :(得分:1)

您所描述的问题称为Reinforcement Learning。强化学习本质上是与控制器耦合的机器学习算法(例如神经网络)。它已用于您提到的所有应用程序,甚至用于drive real cars