我最近在学习人工神经网络,它们的用处引起了我的兴趣。所以我试着制作一个可以玩简单游戏的游戏(2048,之前做了很多次,所以它似乎是一个很好的起点。)但是,我发现了两个问题。
首先是我编程的方式,没有训练数据集。这似乎可以解决,但我还没有找到办法。
第二个是神经网络,似乎只能最小化错误,并且在这个游戏中你试图最大化得分。在任何给定时间,神经网络都没有最佳设置来检查。
我喜欢创建AI的能力,让它在没有我直接教学的情况下学习最好的策略,这就是我决定首先尝试这种格式的原因。那么我的问题是,是否存在一种可以克服这些短缺的NN,或者是在没有这些问题的情况下对其进行编程的方法,或者我只需要切换到不同的算法/程序。如果我必须切换,请建议切换到什么。
感谢您提供任何意见
此外,如果它属于堆栈交换中的不同位置,请说明
答案 0 :(得分:1)
首先,简要回答您的直接问题。但是请按照我的推荐阅读:)
首先是我编程的方式,没有训练数据集。这似乎可以解决,但我还没有找到办法。
我认为一开始没有训练数据集会阻碍你训练的能力。我认为你可以用另一个没有你的NN玩游戏的程序自己生成你自己的训练集。但是,这可能不是您正在寻找的。 p>
第二个是神经网络,似乎只能最小化错误,并且在这个游戏中你试图最大化得分。在任何给定时间,神经网络都没有最佳设置来检查。
这也不是问题,因为你可以define your cost function基本上得分更高,错误更少。也许您可以确定理论最高分数a" 0错误",得分0为100的错误,然后创建适合此模型的成本函数。
还有什么?
" Reinforcement learning"在我看来,似乎与2048最接近,但是像你所知道的所有人都知道,直到你尝试并有证据来支持它!检查一下,看看它是否适合您。该链接的简短引用如下。
强化学习与标准监督学习的不同之处在于,从不提供正确的输入/输出对......