我目前正试图在C ++中编写一个播放炸弹人的AI,我希望将其作为神经网络(强化学习)与CNTK一起实现。该工具包有很多教程和示例,甚至还有一个用于强化学习的教程和示例,但它是用python编写的,我不知道。
是否有任何实用的C ++示例或教程用CNTK教授强化学习?
我的第一个问题是如何使用CNTK C ++ api创建模型。
答案 0 :(得分:0)
要使用C ++ API创建模型,请查看these C++ examples。
对于强化学习,您需要一个可以采取行动并获得奖励的环境。我在C ++中知道的唯一环境是Arcade Learning Environment。 Python中有许多可用的环境,例如openai's gym。
不幸的是,CNTK在C ++中没有RL的任何例子。但是,如果您按照Python示例进行翻译并使用C ++进行翻译,那么就没有理由不能使其工作。