这个学习算法的名称是什么?

时间:2013-12-11 17:39:10

标签: algorithm machine-learning artificial-intelligence

我为AI玩家设计了一种学习算法,尝试不同的方法来赢得游戏,然后继续使用最高赢率的方法。如果最高赢率方法开始失败,则进入具有第二高赢率等的方法......

我需要写一下学习算法,它可以被称为什么?

3 个答案:

答案 0 :(得分:5)

该算法没有名称,因为相对于此类问题的存在,它并不是特别好(无攻击性)。

你正在“解决”的是Multi-armed Bandit问题。 “不同的获胜方法”是您的老虎机,而您的“赢率”是每台老虎机的支付赔率。因为你正在与另一个人对战并且他们可能会改变他们的策略,所以你必须处理最好的老虎机可能“开始失败”的可能性。这是一种对抗性场景。从许多不同的角度/场景中有很多关于这个主题的论文和算法。它研究得很好,人们仍然对它感兴趣。

我认为这是针对某些班级项目的报告。我只是称之为“我的启发式方法”,因为它就是这样。

答案 1 :(得分:1)

这是一个经典的尝试&错误方法。 TryError,TryAndError,TaE,Try& Error-o-matic,选择你喜欢的任何东西。

答案 2 :(得分:1)

这可能取决于你如何实现它。这听起来有点像多级逻辑回归算法。这会评估每个类的给定结果的概率,然后选择最佳概率,但这也可以通过神经网络或其他各种算法来实现。