首先让我描述一下该设置: 我们在Unity中有一个自治的代理,其决策基于感知的环境(级别)和一些预定义的参数来进行值映射。我们的目标是在DNN中预训练代理的参数。因此,这个想法基本上是定义一个误差度量来评估Unity模拟中代理的性能(运行级别,例如,测量与最佳轨迹的偏差=统一的地面真理)。因此,根据DNN的输入级别,网络应训练以输出参数,执行仿真,然后将误差作为误差值(如精度)传递回网络,因此网络可以根据该误差/性能。
在Keras以外的训练期间,有什么方法可以进行评估(与真实情况进行比较)?通常,人们将X数据传递到网络,训练东西并将其与基本事实Y进行比较。这对于预测很有效,但是我不想预测某些东西。我要做的是测量模拟中与地面真实情况的偏差。 我知道有Unity ML代理,但据我所知,``大脑''在运行时控制代理,即在每帧上更新代理并控制运动。我想要执行整个仿真以更新网络的参数/权重。
最良好的祝愿。
答案 0 :(得分:0)
在我的大学进行一些谈话后: 安装程序无法通过这种方式进行,因为我需要拆分流程。
我需要工作人员的参数来仅基于级别描述(例如像视频游戏描述语言这样的矩阵)来训练网络。为了基于实际水平和地面真实数据(例如,偏离轨迹)获得参数化的主体,需要使用带有得分函数的强化深度学习来获得这些参数。因此,Unity ML代理可能会有用。然后,我可以使用参数设置和相关的级别数据来训练网络,使其仅根据级别描述生成所需的参数。