深度神经网络与学习相结合

时间:2015-12-12 23:00:13

标签: deep-learning reinforcement-learning accord.net q-learning sarsa

我使用Kinect相机的关节位置作为我的状态空间,但我认为它太大(25个关节x 30每秒)只能加入SARSA或Qlearning。

现在我正在使用Kinect Gesture Builder程序,该程序使用监督学习将用户移动与特定手势相关联。但这需要有监督的培训,我想要离开。我认为算法可能会在我自己对数据进行分类时获取关节之间的某些关联(例如,举手,左步,右步)。

我认为将这些数据输入深度神经网络然后将其传递给强化学习算法可能会给我一个更好的结果。

最近有一篇论文。 https://www.cs.toronto.edu/~vmnih/docs/dqn.pdf

我知道Accord.net既有深度神经网络又有RL,但有没有人将它们组合在一起?任何见解?

1 个答案:

答案 0 :(得分:0)

如果我从您的问题+评论中正确理解,您想要的是让代理使用视觉输入执行离散操作(来自相机的原始像素)。这看起来与DeepMind最近做过的人一样,扩展了你提到的论文。看看this。这是玩Atari游戏的新版本(也是更好的版本)。它们还提供官方实施,您可以下载here。 甚至有an implementation in Neon也很好用。

最后,如果您想使用连续操作,可能会对此very recent paper感兴趣。

回顾一下:是的,有人合并了DNN + RL,它有效,如果你想使用原始相机数据训练一个RL代理,这绝对是一种方法:)