深度强化学习在将其应用于具有高度动态性质的现实问题时非常有用。很少有例子可以列为金融,医疗保健等。但是当涉及到这些类型的问题时,很难有一个模拟环境。那么有什么可以做的事情呢?
答案 0 :(得分:2)
首先让我评论几个概念,试图根据您的意见为您提供未来的研究方向:
关于在不访问模拟环境的情况下应用RL的原始问题,正如我之前在评论中所说,如果你有足够的数据,你可能会应用RL算法。我假设您可以存储环境中的数据,但您无法轻松与其进行交互。这是典型的,例如,在医疗领域,其中存在许多关于[患者状态,治疗,下一患者状态]的数据,但是您不能通过应用随机治疗与患者交互。在这种情况下,有一些事实需要考虑: