没有训练价值的神经网络学习

时间:2012-01-25 21:28:42

标签: machine-learning reinforcement-learning neural-network

我想知道如何在不提供训练值的情况下训练神经网络。我的前提是神经网络将用于可以从传感器接收正/负反馈的机器人。 IE,为了训练它自由地漫游而不碰到东西,当没有触发碰撞传感器或接近传感器时会发生正反馈。当碰撞/接近传感器被触发时发生负反馈。如何使用这种方法训练神经网络?

我是用C ++编写的

2 个答案:

答案 0 :(得分:5)

您所描述的内容称为强化学习。它可以应用于神经网络,但一般不需要它们。 Richard Sutton和Andrew Barto撰写的关于这一主题的规范教科书是Reinforcement Learning: An Introduction。 James McClelland在PDP Handbook中更详细地探讨了神经网络与强化学习之间的联系。

答案 1 :(得分:1)

你看过SLAM了吗?这是机器人可以用来导航区域的技术,同时建立并保留该区域的地图。