正确的机器人机器学习模型方法

时间:2020-01-22 10:59:46

标签: python azure machine-learning robotics

我正在寻找使用哪种模型或方法的起点。 情况如下:

具有9个输入的机器人:

  • -6个提供距离的传感器

  • -检测到崩溃的传感器

  • -左电机的当前速度
  • -右马达的当前速度

输出: 2个数字(或2个布尔值)来控制2个电机(左前和右前)

现在我正在考虑让机器人找出不崩溃的方式。 我将6个传感器和一个“有效/无效”传感器作为数据输入模型 然后训练一个模型,以便找出一个传感器值低于某个特定数字时,电动机需要比另一个电动机更快的速度以避免碰撞输入的方法。另外,我需要告诉模型需要避免崩溃标志。

现在作为平台,我正在考虑使用树莓派,可能是通过天蓝色连接,所以我可以使用所需的任何模型

但是我要寻找哪种型号?它需要从连续数据中学习。尝试一些东西,把它写回去,从中学到东西,然后再尝试其他东西。输出可能需要是多元回归或多元二进制。

输入也是,多个输入。需要从新的数据点学习。有想法吗?

1 个答案:

答案 0 :(得分:2)

您正在寻找reinforcment learning。关于机器人或游戏AI的文献很多。与您所说的完全一样,它是如何连续工作的。

它(代理)有一个环境(传感器,当前速度),他可以执行动作(控制电动机)来自环境的反应。使用给定的动作,它将获得奖励,例如distance from object < before => +1 else -1。你明白了。通过尝试失败,它将创建自己的政策(其行为),以最大化奖励。

强化中最常用的算法是 Q-Learning (其深度学习方面称为DQN)。

这是一篇可能与您的问题有关的论文:link